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我 接触 ARM 的 历史 约 4 年 ,早期 是 很 欣赏 这 类 处 理 器 ,到 了 后 来 切身 使 用 它们 的 机 会 越 来 越 多 ， 
慢 慢 地 有 了 感觉 ， 也 更 加 喜欢 了 。 在 偶然 听 说 Cortex-M3 后 ， 我 就 冥 冥 地 感到 它 不 寻常 。 只 是 因为 
其 它 工作 一 直 没 有 去 了 解 它 ， 直 到 今年 初 才 进一步 学 习 ， 很 快 孢 觉得 相知 恨 晚 。 当 时 只 能 看 ARM 官 
方 的 重量 级 资料 ， 在 看 到 这 本 书 的 瑞 文 原稿 后 ， 更 感觉 被 电 到 了 一 样 ， 于 是 突然 有 了 把 它 翻 详 成 中 
文 的 冲动 。 经 过 累计 和约 156 个 小 时 的 理 战 ， 终 于 有 了 此 详 稿 。 在 翻 详 过 程 中 ， 我 始终 采用 下 列 指导 
思想 : 

1. 尺 量 使 用 短 句 ， 并 且 把 句子 口语 化 。 我 认为 蜗 深 的 道理 不 一 定 要 用 局 级 的 语法 句 型 才能 表达 。 
想 想 看 ， 即 使 是 儿 位 博士 互相 聊天 讨论 一 个 诛 题 ， 也 还 是 使 用 口语 吧 ， 而 且 火 花 往 往 驶 是 在 这 
种 讨论 中 产生 呢 ! 

2. 多 用 修 辞 方法, 并 且 各 名 引用 表现 力 强 的 词汇 一 一 甚至 包括 网 络 用 语 和 脓 炙 人 口 的 歌词 。 另 外 ， 
有 时 会 加 工 句 子 ， 使 得 风格 像 是 对 话 。 这 样 做 的 目的 是 整个 文风 更 鲜 活 一 一 有 点 像 为 写 出 局 分 
作文 而 努力 的 样子 。 这 点 可 能 与 很 多 学 术 敌 作 的 “严肃 、 平 实 ” 文 风 不 同 ， 也 是 一 次 大 胆 的 答 
试 。 还 希望 读 者 不 音 给 予 反 馈 。 

3， 在 “宏观 ”上 直译 ， 在 “微观 ”上 意译 。 现 语 不 仅 单 一 句子 的 语法 和 汉语 不 同 ， 并 且 句 子 的 连 
贯 方式 也 与 汉语 不 同 。 因 此 在 十 儿 个 到 几 十 个 单词 的 范围 内 ， 我 先 把 它们 翻译 成 脑子 里 的 “中 
则 语言 ”再 把 中 间 语 言 翻 详 成 汉语 。 这 样 ， 束 最 大 地 避免 了 贻 笑 大 方 的 “天 式 汉语 ”。 

4. 有 些 术 语 名 词 不 方便 翻 详 成 汉语 ， 或 者 目前 的 翻译 方式 不 统一 ， 或 者 与 其 它 术 语 翻 译 的 结果 很 
接近 ， 如 error 和 fault， 就 只 能 用 英语 意 会 。 此 时 我 就 保留 英文 单词 ， 相 信 这 样 比 硬 生 生地 
翻译 成 汉语 还 好 。 这 些 词汇 主要 是 :retarget，fault，region 等 。 另 外 ， 英 文中 有 一 个 很 能 
精练 表达 “两 者 都 ”意思 的 单词 及 其 用 法 : ”both”， 我 也 常常 你 留 之 。 

5。 图 表 对 闫 色 的 使 用 比较 丰满 ， 尤 其 是 比较 大 型 的 插图 ， 相 信 这 样 能 帮助 读者 分 析 和 理解 。 插 图 
是 从 原 图 直接 复制 的 ， 因 此 矢量 图 变 成 了 位 图 ， 无 法 再 适应 任何 比例 的 盎 放 。 不 过 ， 我 在 复制 
原 图 时 ， 把 原 图 以 288% 的 比例 放大 ， 从 而 提高 了 图 片 的 质量 。 

6. 我 在 很 多 地 方 加 了 译注 。 比 较 短 的 详 注 耽 直 接 以 “()” 加 在 文字 后 面 。 比 较 长 的 译注 则 为 它 开 
出 一 个 “文学 池 ” 放 到 相应 的 “.text” 后 耐 并 与 之 相 临 。 早 期 的 译注 多 用 于 解释 一 些 不 是 很 
广为人知 的 术语 ， 后 期 的 译注 则 更 多 是 我 认为 有 必要 补充 的 内 容 ， 包 括 访 者 在 疯 谈 过 程 中 可 能 
会 产生 的 问题 ， 容 易 混 消 的 概念 ， 深 入 理解 等 。 

7. 我 对 少量 目 然 段 作 了 改编 。 也 有 个 别 部 分 译 目 ARM 提供 的 权威 文档 。 

本 书 的 翻译 工作 在 46% 进 度 的 时 候 是 最 困难 的 时 期 ， 有 一 种 好 像 长 跑 中 遇 到 了 上 所谓“ 极限 ”的 
感觉 。 望 独 距 离 反 下 去 还 有 那么 高 的 浚 动 条 ， 甚 至 都 有 俘 住 的 目 我 暗示 了 了。 那天 了 刚好 是 袁 恒 日 的 第 
一 天 , 我 本 来 情绪 很 低沉 , 但 在 我 看 到 默 表 完毕 , 天 安 门 广场 上 排山倒海 股 地 呐喊 “中 国 加 油 ” 时， 
我 突然 有 了 强烈 的 共振 感觉 ， 那 古 一 种 热泪 鳃 眶 的 激动 和 感叹 ， 甚 至 觉得 他 们 就 是 在 致 励 我 ! 让 我 

-下子 振作 起 来 ， 找 回 了 比 刚 开 始 还 要 强烈 的 干 雪 ， 并 且 更 加 信心 满 满 。 这 种 精神 力量 一 直 推 动 我 
翻译 完 最 后 一 个 字 ， 并 且 还 有 “ 余 勇 可 页 ”的 快感 ^ ^ 

整个 翻译 的 时 间 跨 度 是 在 2868.65.16-2668.66.67, 工 | 28 天. 不知 这 是 否 算得 上 很 “仓促 ” 
想必 有 很 多 句 式 还 能 改 得 更 好 ， 甚 全 还 有 错别字 等 低级 错误 。 我 使 用 了 五 笔 输 入 法 ， 可 能 错别字 会 
错 得 很 离奇 ， 不 过 肯定 逃 不 过 读者 雪亮 的 双眼 的 。 和 希望 读者 在 发 现 错误 后 批评 指正 。 反 馈 地 址 
是 : Prock.song@hotmail.com， 也 可 以 通过 QQ:9471262/9312566。 

本 译 稿 草稿 完成 后 , 我 交 给 几 位 好 友 去 试 恋 和 审 校 , 得 以 揪 出 了 很 多 大 大 小 小 的 bugs。 他们 是 : 
浮云 ， 土 豆 波 ， 美 由 Y， 李 天 后 。 在 这 里 以 点 名 表示 感谢 ! 
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在 本 译文 的 酝 本 斯 和 翻译 的 全 过 程 ， 我 的 兄 第 魏 国 平一 直 屁 励 我 ， 相 信和 这 是 对 社会 有 益 的 事 ， 
并 且 给 从 精神 和 物质 上 给 我 打气 和 文 招 。 这 只 是 他 八 年 来 与 我 兄弟 之 间 的 一 段 小 掠影 ， 在 此 感谢 之 
情 已 难以 言 表 ! 他 的 能 力也 是 我 非常 佩服 的 ， 他 仪 在 加 入 国内 视频 监控 业 的 老大 “ 海 康 威 视 ” 一 年 
后 ， 就 在 只 有 二 人 当选 的 最 佳 员 工 中 榜 上 有 和 名。 

在 本 书 翻译 的 后 期 , 我 告知 了 父母 ,虽然 他 们 知道 这 会 冲击 我 的 工作 , 但 依然 支持 我 继续 下 去 。 
对 父母 的 感谢 早已 超出 任何 语言 和 行动 所 能 及 的 程度 ， 因 此 不 多 提 也 罢 。 

本 译文 完成 后 ， 我 交 给 了 4 位 好 友 去 试 读 。 在 这 里 为 他 /她 们 “正名 ” 黄强 ， 杨 波 ， 马 铭 遥 ， 
李 武 华 。 他 们 不 仅 评估 了 译文 在 “文笔 “上 的 质量 , 还 找 出 了 一 些 错 误 。 尤 其 是 黄强 ,他 和 他 的 “ 先 
锋 突 击 队 ”率先 “软硬兼施 ”地 实践 过 基于 CM3 的 STM32 单片机 ， 并 且 从 人 文 的 层面 上 对 各 种 读者 
的 口味 都 很 了 解 ， 因 此 为 我 提出 最 多 的 技术 上 和 文风 上 的 建议 。 在 内 测 期 和 译文 发 表 后 ， 我 多 次 和 
他 一 起 讨论 如 何 改进 。 另 外 ， 他 也 是 带 我 认 知 CM3 的 第 一 人 。 

后 来 ,我 的 恩师 吴 建 德 在 看 过 译文 后 ， 怠 组 织 他 带领 的 研究 生 去 在 新 项 目 中 使 用 基于 CM3 的 单 
片 机 ， 并 且 研 究 在 电源 与 拖 动 控制 器 中 ， 从 16 位 DSP 转 到 CM3 上 的 一 些 课 题 ， 还 鼓励 我 继续 做 类 
似 的 工作 。 他 和 实验 室 的 精英 们 以 实际 的 先锋 行动 给 了 我 很 大 的 鼓励 。 

在 “内 部 测试 ”期 间 和 网 上 发 表 后 ， 我 的 好 友 蜗 明和、 李 小 林 、 梁 纪 采 、 沈 争 、 王 金成 、 杨 福 
双 、 叶 枫 和 于 艳 良 都 支持 我 发 表 ， 并 且 在 我 工作 之 余 为 我 计划 未 来 的 蓝图 ， 王 金成 还 经 党 是 我 吐 若 
水 时 的 受害 者 。 他 们 的 友情 扫除 了 我 在 工作 中 的 枯燥 ， 并 且 让 我 更 加 信心 满 满 ! 

在 经 过 “内 部 测试 版 ”后 ， 本 译文 的 初稿 是 发 表 在 www.ouravr .com 的 论坛 上 的 。 阿 莫 站 长 在 
帖子 发 表 后 的 第 一 时 间 〈 已 经 是 凌晨 ) 束 置 “ 酷 ”， 后 来 义 置顶 ， 再 后 来 还 专门 开 出 一 个 Cortex-M3 
技术 讨论 区 ， 并 任命 我 为 第 一 任 版 主 。 阿 英 给 了 我 一 个 大 舞台 ， 这 也 是 一 个 大 家 畅所欲言 、 求 医 问 
道 、 展 现 自己 闪 亮 的 大 舞台 。 这 里 自由 开放 ， 甚 至 不 需要 登录 就 可 以 下 载 资源 ! 在 这 里 再 次 癌 阿 莫 
站 长 致敬 ! 

帖子 发 表 后 ，ouravr 的 很 多 热心 网 友 回 贴 薄 励 我 ， 顶 我 的 贴 子 直 到 顶 到 置顶 。 难 能 可 贵 的 是 
watercat 还 第 一 个 警示 我 不 要 乐 民 了 头 ， 提 出 我 的 这 种 翻译 方式 和 文风 会 面临 的 风险 。 这 在 我 校 
对 的 过 程 中 起 了 很 多 指导 作用 。 

帖子 发 表 后 才 两 天 ， 北 航 出 版 社 的 胡 晓 柏 主任 整 联 系 我 ， 与 我 讨论 出 版 的 事宜 。 胡 主任 其 实 早 
就 苇 眼 识 中 了 这 本 书 的 原版 ， 从 而 北航 出 版 社 购 得 本 书 的 简体 版 版 权 。 于 是 ， 本 书 中 文 版 的 出 版 徇 
直 是 大 路 通天 般 的 顺畅 ! 我 以 前 没有 出 版 过 书 ， 胡 主任 一 直 奉 心地 解答 我 的 每 个 疑问 ， 无 论 在 邮件 
中 还 是 电话 里 ， 都 平易 近 人 。 在 商务 上 ， 和 胡 主 任 与 北航 出 版 社 的 合作 也 轻松 愉快 ， 比 我 谈 的 绝 大 
多 数 项 目 都 容易 得 多 。 推荐 大 家 有 好 作品 整 去 找 他 , 最 近 的 一 本 热 销 书 《 匠 人 人 手记》 也 是 胡 主 任 “ 执 
着 ”的 成 果 。 

后 来 我 得 知 ， 是 周 立 功 先生 在 看 到 译文 后 ， 推 荐 使 用 这 个 译文 出 版 的 。 后 来 周公 还 来 信 豆 励 我 
再 接 再 厉 。 我 以 前 读 过 周公 的 一 篇 讲学 习 点 RTOS 的 文章 后 曾 热血 沸腾 ， 在 此 对 周公 的 大 度 和 鼓励 
我 非常 感激 。 

后 来 在 上 海 沁 科 的 王 永 虹 经 理 主办 的 一 次 活动 中 , 我 和 瑞 价 特 的 周 麒 相 叙 多 时 。 我 希望 能 由 ARM 
中 国 的 总 裁 谭 军 先生 写 序 ， 经 过 周 麒 的 表 奏 后 ， 谭 总 欣然 同意 了 。 这 样 落地 有 声 的 肯定 ， 我 在 继续 
前 进 的 路 上 还 有 什么 好 犹豫 的 ! 我 现在 觉得 我 加 入 了 一 个 充满 战斗 力 并 且 温 暖和 谐 的 精英 先锋 队 ， 
为 了 让 32 位 单片机 新 生 代 的 春风 化 十 早日 润 志 人 间 而 激情 战斗 ! 

谭 总 把 此 事 告 知 了 原作 者 ， 他 的 中 文 名 是 姚 文 祥 先 生 。 他 也 很 高 兴 地 重新 号 了 中 文 版 六 言 ， 并 
且 还 把 今年 夏天 Cortex-M3 最 新 修 订 版 的 更 狐 内 容 友 给 我 , 以 使 此 书 与 时 俱 进 。 姚 先生 的 敬业 和 热 
青 是 令 人 肃然 起 敬 的 ! 
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感谢 纸 厂 的 读者 您 。 您 的 阅读 融 是 对 我 工作 的 肯定 和 或 励 ， 并 且 我 也 因为 祖国 的 对 入 式 领 域 在 
问 次 世代 挺进 的 过 程 中 ， 又 多 了 一 位 生力军 而 兴 香 不 已 ! 
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谁 是 最 节能 ,最 擅长 把 好 钢 用 在 刀刃 上 的 人 ? 要 让 我 说 我 一 定 得 表 一 表单 片 机 的 开发 者 。 
他 们 使 出 浑身 解 术 写 出 精妙 玲珑 的 代码 ， 把 单片机 点 点 滴 滴 的 力量 汇集 起 来 ， 让 它 如 同 涌 泉 一 
般 尽 情 地 进 友 ， 洪 溉 滋 错 着 各 行 各 业 。 是 什么 灵丹妙药 赐予 了 他 们 这 么 神奇 的 力量 ? 天 供 陪 惑 
是 主观 方面 。 在 客观 方面 ， 除 了 有 好 的 处 理 器 之 外 ， 还 要 配合 好 的 开 友 环境 和 工具 链 。 也 正 出 
于 此 ， 在 设计 ARM7TDMI 处 理 器 时 ，ARM 的 工具 链 工 程 师 们 和 CPU 设计 师 们 强 强 联 手 ， 为 了 
让 它 的 内 部 结构 更 优化 、 更 精练 、 更 到 位 而 并 肩 备战 了 很 多 日 日 夜 夜 ， 终 于 有 了 ARM7TDMj 
的 无 限 辉 焊 ， 并 且 久 经 岁月 的 洗礼 依旧 光芒 绽放 。 

珠联璧合 的 最 新 果实 ， 是 破 蔓 而 出 的 ARM Cortex-M3 处 理 器 。 这 个 小 尤物 ， 处 处 闪耀 着 
ARM 体 系 结构 最 激动 人 心 的 新 突破 。 它 基于 最 新 最 好 的 32 位 ARMv7 架 构 一 一 这 个 架构 支持 高 
度 成 功 的 Thumb-2 指 令 集 ， 还 有 很 多 时 尚 、 前 卫 甚 至 炙 新 的 特性 ， 充满 了 新 生 代 的 气息 。 它 在 
很 好 、 很 强大 的 同时 ， 编 程 模型 却 变 得 更 加 清新 底 洁 了 。 不 管 你 是 得 国 的 花灯 、 是 人 民 教 师 、 
还 是 精明 的 商人 ， 也 无 所 谓 是 新 手 还 是 骨灰 级 玩家 ，Cortex-M3 都 将 尽情 展现 它 的 秀 外 慧 中 ， 
带 给 你 喜出望外 的 收获 和 “激活 ” ! 

ARM 多 入 陈 解 决 方案 主任 


Wayne Lyons 
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不 管 你 是 做 软件 的 还 是 做 硬件 的 ,只 要 相 中 了 ARM 的 Cortex-M3 处 理 器 ,这 本 书 就 是 
为 你 而 写 。 以 前 Cortex-M3 的 资料 只 有 两 个 大 部 头 ， 分 别 是 : 
@ 《Cortex-M3 技 术 参 考 手 册 》 ( Cortex-M3 Technical Reference Manual, 简称 
Cortex-M3 TRM ) 
@ 《ARMv7-M 应 用 程序 级 架构 参考 手册 》( ARMv7-M Application Level Architecture 
Reference Manual ) 
虽然 这 它 俩 差不多 是 权威 到 “古文 观 止 "级 的 ， 但 实在 是 太 深 入 了 ， 以 致 于 对 新 手 来 
说 那 简 站 就 是 天 书 。 本 书 则 是 一 个 精简 版 ， 并 且 氢 述 的 前 后 更 有 条 理 。 目 标 读者 包括 : 
一 线程 序 员 ， 同 入 式 产品 设计 师 ,片上 系统 ( SoC ) 工程 师 , 嵌入 式 系统 发 烧 友 ,学院 
研究 员 ， 还 包括 所 有 涉猎 过 单片机 和 微 处 理 器 领域 ， 慧 眼 识 珍 看 中 了 Cortex-M3 的 人 民 
大 众 们 。 
本 书 要 给 Cortex-M3 的 架构 做 一 个 简介 ,浏览 一 下 指 全 系统 ， 写 几 个 段 代 码 练 练 手 ， 
说 一 些 硬 件 特性 , 再 表 一 表 该 处 理 器 精深 的 调试 系统 。 本 书 还 给 出 了 应 用 程序 范例 , 手 
把 手 地 教 你 使 用 开发 工具 ， 包括 ARM 的 工具 和 GNU 的 工具 链 。 如 果 你 以 前 是 ARM7TDMI 
的 玩家 ， 正 准备 着 升级 装备 到 Cortex-M3 ,本 书 也 非常 解渴 ,里面 讲述 了 两 者 的 不 同 ， 


以 及 乌 枪 换 炮 的 升级 过 程 。 
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AHB-AP 
AMBA 
APB 
ARM ARM 
ASIC 
ATB 
BE8 
CPI 
CPU 
DAP 
DSP 
DWT 
ETM 
FPB 
FSR 
HTM 
ICE 
IDE 
IRQ 
ISA 
ISR 
ITTM 
JTAG 
JTAG-DP 
LR 
LSB 
LSU 
MCU 
MMU 
MPU 
MSB 
MSP 
NMI 
NVIC 
OS 
PC 
PSP 
PPB 


D> 


义 

AMBA 设 计 套 件 
先进 高 性 能 总 线 
AHB 访 问 病 口 

先进 单片机 总 线 架构 
先进 外 设 总 线 
ARM 架 构 参 考 手 册 

行业 领域 专用 集成 电路 
先进 跟踪 总 线 

学 方 不 和 变 式 大 闹 模 式 

每 条 指令 的 周期 数 

中 央 处 理 单元 

调试 访问 问 口 

数字 信号 处 理 右 / 数字 信号 人 处理 
数据 观察 点 及 跟踪 

航 入 式 跟踪 宏 单元 
闪存 地 址 重 载 及 断 点 
Fault 状 态 寄存 喜 
CoreSight AHB 跟 踪 宏 单元 
在 线 仿 真 器 
集成 开 友 环境 

中 断 请 求 〈 通 第 是 指 外 部 中 断 的 请 求 ) 
指令 系统 架构 

中 汤 服 务 例 程 
仪器 化 跟踪 宏 单元 

连结 点 测试 行动 组 〈 一 个 关于 测试 和 调试 接口 的 标准 ) 
JTAG 调 试问 口 

连接 寄存 器 
最 低 有 效 位 

加 载 /存储 单元 

微 控制 器 单元 〈 俗 称 单片机 》 
存储 器 管理 单元 
存储 器 保护 单元 
最 高 有 效 位 

主 堆栈 指针 

不 可 屏蔽 中 断 

秽 套 癌 量 中 断 控 制 吉 
操作 系统 

程序 计数 器 

进程 堆栈 指针 
私有 外 设 总 线 
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本 书 大 面积 地 使 用 了 如 下 的 排版 字体 约定 : 


。 普通 汇编 代 伍 

MOV RO, R1 ; 把 寄存 器 R1 中 的 数据 移 全 RO 

。 以 模式 化 语法 表示 的 汇编 代码 一 一 编程 时 必须 使 用 真实 的 寄存 器 名 字 
MRS <reg>, <special reg> ，} 

。C 程序 代码 

for (i=0;i<3;i++) { funcl(); } 

。 伪 代码 


二 








。 数值 : 

1. 4'hC, 0x123 都 表示 16 进 制 数 

2. #3 表示 数字 3 (e.g., IRQ #3 就 是 指 3 号 中 断 ) 

3. 蕴 mmea_12 表 示 一 个 12 位 的 芯 即 数 

4. 寄存 器 位 。 通 芝 是 表示 一 个 位 段 的 数值 ， 例 如 
bit[15:12] 表示 位 序号 从 15 往 下 数 到 12， 这 一 段 的 数值 。 





寄存 器 访问 类 型 

1. R 表示 只 读 

2. ”W 表 示 只 瑟 

3. ”RW 表示 可 读 可 写 〈 前 3 条 好 像 地 球 人 都 知道 ) 
4. R/Wc 表示 可 谈 ， 但 是 与 访问 将 使 之 清 0 
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1. Cortex-M3 Technical Reference Manual (TRM) (Cortex-M3 龙 大 参考 天 WW) 
请 从 www.arm.com/documentation/ARMProcessor Cores/index.html 下 载 


2. ARMv7-M Architecture Application Level Reference Manual(ARMv7-M/Y /RK 笑 鸭 参 考 天 NN)) 
请 从 www.arm.com/products/CPUs/ARM_Cortex-M3_v7.html 下 载 


3. CoreSight Technology System Desiegn Guide (CoreSight 大 大 系 统 充 人 太 谣 星 ) 
请 从 www.arm.com/documentation/Trace Debus/index.html 下 载 


4. AMBA Specification (AMBA 人 zt) 
请 从 www.arm.com/products/solutions/AMBA_Spec.html 下 载 


5. AAPCS Procedure Call Standard for the ARM Architecture(AAPCS 4RM 兢 记 好 三 萝 万 计 汐 
请 从 www.arm.com/pdfs/aapcs.pdf 下 载 


6. RVCT 3.0 Compiler and Library Guide(RVCT 3.0 编 说 诅 矿 放 /9 时) 
请 从 www.arm.com/pdfs/DUI0205G rvct_compiler and libraries_suide.pdf 下 载 


7. ARM Application Note 179: Cortex-M3 Embedded Software Development(ARM/Y /1 针 718179: 
Cortex-M3 谍 A 式 fH) 
请 从 www.arm.com/documentation/Application_Notes/index.html 下 载 








译注 : 这 些 资 料 部 不 是 什么 “省 油 的 灯 ”， 赔 读 起 来 可 能 比较 吃力 ， 条 理性 也 未 必 很 明显 。 因 
此 不 必 强 求 目 己 一 下 子 读 完 。 最 好 把 它们 当 作 后 备 参 考 资 料 , 过 到 疑难 时 再 诉 诸 于 它们 找 答 双 。 
太 外 ，3 号 和 4 号 资料 更 倾 问 于 心 万 设计 师 的 口味 。 
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@@ ARM Cortex-M3 处 理 器 初探 
@@ ARM 的 各 种 架构 版 本 

全 指令 集 的 开发 

@ Thumb-2 指 令 集 架 构 (ISA) 
@ Cortex-M3 的 舞台 

@ 木 书 组 织 

全 深入 研究 用 的 读物 


1.1 ARM Cortex-M3 处 理 器 初探 














单片机 市 场 的 规模 可 以 用 “ 巨 无 霸 ” 来 形容 ， 预 计 到 2010 时 每 年 能 有 20G 片 的 出 货 量 。 世 界 各 
地 的 右 件 供应 商 纷 纷 完 出 自己 的 得 意 之 作 ， 他 们 提供 的 器 件 和 架构 也 是 各 具 特 色 。 业 界 内 部 可 谓 是 
百花 章 放 ， 热 闹 非 几 ， 好 戏 不 断 。 各 行 各 业 对 单片机 能 力 的 要 求 也 一 直 “ 得 寸 进 尺 ”， 而 且 还 又 要 
马 儿 跑 ， 又 要 马 儿 不 吃 草 一 一 处 理 器 必须 在 不 怎么 增加 主 频 和 功 耗 的 条 件 下 干 更 多 的 活 儿 。 另 一 方 
面 ， 处 理 器 之 间 的 互 连 也 在 加 深 ， 看 这 一 串 串 熟悉 的 字眼 : 串口 ，USB， 以 太 网 ， 无 线 数 传 …. 处 理 
器 如 欲 文 持 这 些 数据 通道 ， 束 必须 在 片上 守 进 更 多 的 外 设 。 软 件 方面 的 情况 也 如 出 一 入 : 应 用 程序 
的 功能 一 直 在 花样 翻新 ， 性 能 需求 也 是 变本加厉 : 更 高 的 运算 速度 ， 更 硬 的 实时 能 力 ， 更 多 的 功能 
模块 ， 于 炫 的 图 形 界 面 ，……… 所 有 这 些 要 求 单片机 都 得 照 单 全 收 。 在 这 个 大 环境 下 ，ARM Cortex-M3 
处 理 占 ， 作 为 Cortex 系 列 的 处 女 作 ， 为 了 让 32 位 处 理 器 入 主 作 庄 单片机 市 场 ， 胡 和 玻 烈 烈 地 诞生 了 ! 
由 于 采用 了 最 新 的 设计 技术 ， 它 的 门 数 更 低 ， 性 能 却 更 强 。 许 多 曾经 只 能 求助 于 高 级 32 位 处 理 右 或 
DSP 的 软件 设计 ， 痢 能 在 CM3 上 跑 得 很 快 很 欢 。 骸 入 式 处 理 器 市 场 正 在 32 位 化 ， 相 信用 不 了 多 久 ， 
CM3 就 一 定 会 在 这 美丽 新 世界 中 肪 蒜 而 出 。 比 当年 8051 推 动 整个 业界 还 有 过 之 而 无 不 及 ， 再 次 放 改 
工程 师 们 的 梦想 ， 让 深 埋 于 心底 多 年 的 凤 愿 迎 来 dreams come true 的 激动 ! 

CM3 的 招牌 功夫 包括 : 

。 性 能 强劲 。 在 相同 的 主 频 下 能 做 处 理 更 多 的 任务 ， 全 力 支 持 劲 爆 的 程序 设计 。 

。 功 耗 低 。 延 长 了 电池 的 寿命 一 一 这 人 简直 就 是 便携 式 设备 的 命 门 〈《 如 无 线 网 络 应 用 )。 

。 实时 性 好 。 采 用 了 很 前 卫 甚至 革命 性 的 设计 理念 ， 使 它 能 极速 地 响应 中 断 ， 而 且 响 应 中 断 所 

需 的 周期 数 是 确定 的 。 

。 代码 密度 得 到 很 大 改善 。 一 方面 力 插 大 型 应 用 程序 ， 另 一 方面 为 低 成 本 设计 而 省 吃 伶 用 。 

。 使 用 更 方便 。 现 在 从 8 位 /16 位 处 理 器 转 到 32 位 处 理 器 之 风 刊 得 越 来 越 猛 ， 更 简单 的 编程 模型 

和 更 透彻 的 调试 系统 ， 为 与 时 俱 进 的 人 们 大 大 减负 。 

。 低 成 本 的 整体 解决 方案 。 让 32 位 系统 比 和 8 位 /16 位 的 还 便宜 ， 低 端的 Cortex-M3 单 片 机 甚至 还 

卖 不 到 1 美元 。 

。 裔 地 开花 的 优秀 开发 工具 。 人 免费 的 ， 便 宜 的 ， 全 能 的 ， 要 什么 有 什么 。 

基于 Cortex-M3 内 核 的 处 理 器 已 渐 成 气候 ， 以 处 处 满 溢 的 先进 特性 力 压 群芳 。 而 且 架 构 师 们 还 在 
不 俘 地 求索 降低 成 本 的 出 路 ， 同 时 很 多 组 织 也 在 答 试 独 实现 “ 喜 件 聚合 ”(device aggregation) ， 使 
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一 个 单一 的 小 强 蕊 片 可 以 抵 得 上 以 击 3、4 块 传统 的 单片机 。 

降低 成 本 还 有 一 招 ， 就 是 使 基础 代码 在 所 有 系统 中 都 可 以 重用 ， 至 少 要 方便 移植 。CM3 的 内 核 
架构 非常 精工 细作 ， 使 它 与 C 语 言 成 为 了 一 个 梦幻 绝 配 。 优 质 的 C 程 序 代 码 三 下 五 除 二 就 可 以 移植 并 
重用 ， 使 升级 和 移植 一 下 子 从 拦路 席 变 成 了 纸老虎 。 

值得 一 提 的 是 ，CM3 并 不 是 第 一 个 被 拿 去 做 万 金 油 型 处 理 器 的 内 核 。 那 廉 颇 虽 老 却 依然 戏 勇 的 
ARM7/ARM9 处 理 堪 ， 在 通用 仍 入 式 处 理 吕 市场 中 德高望重 ， 全 今 拥 有 无 数 铁杆 粉丝 。 半 导体 业界 的 
群 现 们 ， 像 NXP 〈philips) 、TI、Atmel、OKI、ST 等 ， 都 以 ARM 为 内 核 ， 做 出 了 各 目 号 怀 绝技 的 32 位 
MCU。ARM7 作 为 最 受 欢迎 的 32 位 能 入 式 处 理 需 ,被 载 入 了 之 煜 焊 的 几 页 史册 一 一 每 年 超过 10 亿 请 出 
货 量 ， 为 各 行 各 业 的 散 入 式 设 备 中 都 找 得 到 它们 的 映 影 。 

CM3 作 为 ARM7 的 后 继 者 , 大 刀 阔 人 荐 地 改革 了 设计 架构 ,从 而 显著 地 简化 了 编程 和 调试 的 复杂 度 ， 
处 理 能 力也 更 加 强大 。 除 此 之 外 ，CM3 还 突破 性 地 引入 了 很 多 时 尚 的 甚至 办 新 的 技术 ， 专 门 满足 单 
片 机 应 用 程序 的 需求 。 比 如 ， 服 务 于 “使 命 -关键 ”应 用 的 不 可 屏蔽 中 断 ， 极 度 敏 捷 并 且 拥 有 确定 性 
的 髋 套 癌 量 中 断 系 统 ， 原 子 性 质 的 位 操作 ， 还 有 一 个 可 选 的 内 存 保护 单元 。 这 些 令 人 惊 枢 和 振奋 的 
新 特性 ， 让 老 的 ARM 玩 家 们 再 次 找到 “初恋 ”时 烈焰 进发 的 感觉 ， 也 使 注水 相逢 区 有 激 磷 触电 般 的 
体验 ! 相信 读者 一 旦 有 机 会 用 到 了 它 ， 就 会 为 它 的 秀 外 慧 中 而 赞叹 ， 爱 不 释 手 ! 















































1.1.1 从 Cortex-M3 处 理 器 内 核 到 基于 Cortex-M3 的 MCU 


Cortex-M3 处 理 器 内 核 是 单片机 的 中 央 处 理 单元 (CPU) 。 完 整 的 基于 CM3 的 MCU 还 需要 很 多 其 
它 组 件 。 在 芯片 制造 商 得 到 CM3 处 理 器 内 核 的 使 用 授权 后 ， 它 们 就 可 以 把 CM3 内 核 用 在 自己 的 硅 片 
设计 中 ， 添加 存储 器 ， 外 设 ，I/0 以 及 其 它 功 能 块 。 不 同 厂家 设计 出 的 单片机 会 有 不 同 的 配置 ， 包括 
存储 器 容量 、 类 型 、 外 设 等 都 各 具 特 色 。 本 书 主 讲 处 理 器 内 核 本 身 。 如 果 想 要 了 解 某 个 具体 型 号 的 
处 理 器 ， 还 需 查 阅 相 关上 三 家 提供 的 文档 。 

















由 ARM 设 计 


由 心 户 制 造 商 
设计 开发 





1.1.2ARM 及 ARM 架构 的 背景 


1.1.2.1 一 路 走 来 


让 我 们 回 顿 一 下 ARM 的 进化 史 ， 你 会 知道 为 什么 会 有 郧 种 如 此 之 多 的 ARM 处 理 占 和 ARM 染 构 。 
ARM 在 1990 年 成 立 , 当初 的 名 字 是 “Advanced RISC Machines Ltd.”, 当时 它 是 三 家 公司 的 合资 一 一 
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它们 分 别 是 苹果 电脑 ，Acorn 电 脑 公司 ， 以 及 VLSI 技术 《公司 ) 。 在 1991 年 ，ARM 推 出 了 ARM6 处 理 
囊 家 族 ，VLSI 则 是 第 一 个 吃 螃 蟹 的 人 。 后 来 ， 陆 续 有 其 它 巨 头 : 包括 TI, NEC, Sharp, ST 等 ， 都 获取 了 
ARM 授 权 ， 它 们 真正 地 把 ARM 处 理 器 大 面积 地 辅 开 ， 使 得 ARM 处 理 器 在 手机 ， 便 盘 控 制 器 ，PDA， 
家 庭 娱 乐 系统 以 及 其 它 消 费 电 子 中 都 大 展 雄 才 。 

现 如 今 ，ARM 芯 片 的 出 货 量 每 年 都 比 上 一 年 多 20 亿 片 以 上 。 不 像 很 多 其 它 的 半导体 公司 ，ARM 
从 不 制造 和 销售 具体 的 处 理 右 心 片 。 取 而 代 之 的 ， 是 ARM 把 处 理 器 的 设计 授权 给 相关 的 商务 合作 伙 
伴 ， 让 他 们 去 根据 自己 的 强项 设计 具体 的 芯片 ， 这 些 伙伴 可 都 是 巨头 啊 。 基 于 ARM 低 成 本 和 高 效 的 
处 理 右 设计 方案 ， 得 到 授权 的 厂商 生产 了 多 种 多 样 的 的 处 理 器 、 单 厂 机 以 及 片上 系统 (SoC)。 这 种 商 
业 模 式 就 是 所 谓 的 “知识 产权 授权 ”。 

除了 设计 处 理 器 ，ARM 也 设计 系统 级 IP 和 软件 P。 为 了 挺 它们 ，ARM 开 发 了 许多 配套 的 基础 开 
发 工具 、 便 件 以 及 软件 产品 。 使 用 这 些 工 具 ， 合 作 伙伴 可 以 更 加 舒心 地 开发 他 们 目 己 的 产品 。 


1.2 ”ARM 的 各 种 架构 版 本 


ARM 十 几 年 如 一 日 地 开发 新 的 处 理 器 内 核 和 系统 功能 块 。 这 些 包括 流行 的 ARM7TDMI 处 理 器 ， 
还 有 更 狐 的 高 档 产 品 ARM1176TZ(F)-S 处 理 器 ， 后 者 能 拿 去 做 高 档 手 机 。 功 能 的 不 断 进 化 ， 处 理 水 平 
的 持续 提高 ， 年 深 日 久 造 就 了 一 系列 的 ARM 架 构 。 要 说 明 的 是 ， 架 构 版 本 号 和 名 字 中 的 数字 并 不 是 
一 公事 。 比 如 ，ARM7TDMI 是 基于 ARMv4T 架 构 的 〈T 表 示 文 持 所 humb 指 令 “) ; ARMv5TE 架 构 则 是 伴 
随 看 ARM9E 处 理 喜 家 族 亮 相 的 。ARM9E 家 族 成 员 包 括 ARM926E-S 和 ARM946E-S。ARMYv5TE 架 构 添 加 了 
“服务 于 多 媒体 应 用 增强 的 DSP 指 令 ”。 

后 来 又 出 了 ARM11，ARM11 是 基于 ARMv6 架 构建 成 的 。 基 于 ARMv6 架 构 的 处 理 器 包括 
ARM1136J(F)-S，ARM1156T2(F)-S， 以 及 ARM1176JZ(F)-S。ARMv6 是 ARM 进 化 史上 的 一 个 重要 里 程 碑 :; 
从 那 时 候 起 ， 许 多 窒 破 性 的 新 技术 被 引进 ， 存 储 融 系统 加 入 了 很 多 的 革新 的 特性 ， 单 指令 流 多 数据 
流 (SIMD) 指令 也 是 从 v6 开 始 首 次 引入 的 。 而 最 前 卫 的 新 技 术 ， 允 是 经 过 优化 的 Thumb-2 指 令 集 ， 
它 专 为 低 成 本 的 单片机 及 汽车 组 件 市 场 。 

ARMv6 的 设计 中 还 有 为 一 个 重大 的 决定 : 虽然 这 个 染 构 要 能 上 能 下 ， 从 最 低 问 的 MCU 到 最 局 六 
的 “应 用 处 理 器 ”都 通 吃 ， 但 不 能 因此 就 这 也 会 ， 那 也 会 ， 但 束 古 都 不 精 。 仍 须 定位 准确 ， 使 处 理 鼎 
的 架构 能 胜任 每 个 应 用 领域 。 结 果 就 是 ， 要 使 ARMv6 能 够 灵活 地 配置 和 剪裁 。 对 于 成 本 敏感 市 场 ， 
要 设计 一 个 低 门 数 的 架构 ， 让 她 有 极 强 的 确定 性 ， 另 一 方面 ， 在 高 端 市 场 上 ， 不 管 是 要 有 丰 遇 功能 
的 还 是 要 有 高 性 能 的 ， 都 要 有 拿 得 出 手 的 好 东西 。 

最 近 的 几 年 ， 基 于 从 ARMv6 开 始 的 新 设计 理念 ，ARM 进 一 步 扩 展 了 它 的 CPU 设计 ， 成 果 就 是 
ARMv7 架 构 的 内 党 登场 。 在 这 个 版 本 中 ， 内 核 染 构 首 次 从 蛙 一 球 式 变 成 3 种 球 式 。 

@ 蒜 式 A: 设计 用 于 高 性 能 的 “开放 应 用 平台 ”一 一 越 来 越 接 近 电 脑 了 
@ 蒜 式 R: 用 于 高 端的 能 入 式 系 统 ， 尤 其 是 那些 市 有 实时 要 求 的 一 一 又 要 快 又 要 实时 。 
@ 球 式 M: 用 于 深度 租 入 的 ， 单 请 机 风格 的 系统 中 一 一 本 书 的 主角 。 

让 我 们 再 进 距 离 地 考察 这 3 种 款式 : 

@ 款式 A CARMv7-A) : 需要 运行 复杂 应 用 程序 的 “应 用 处 理 器 ”“ 涪 。 支 持 大 型 嵌入 式 操 作 系 统 (不 

一 定 实时 一 一 译注 ) ， 比 如 Symbian《〈 话 基 亚 智能 手机 用 ) ，Linux， 以 及 微软 的 Windows CE 和 智 

能 手机 操作 系统 Windows Mobile。 这 些 应 用 需要 劲爆 的 处 理性 能 ， 并 且 需 要 便 件 MMU 实 现 的 完 

整 而 强大 的 虚拟 内 存 机 制 ， 还 基本 上 会 配 有 Java 支 持 ， 有 时 还 要 求 一 个 安全 程序 执行 环境 〈 用 

于 电子 商务 一 一 译注 ) 。 典型 的 产品 包括 高 问 手 机 和 手持 仪器 ， 电子 钱包 以 及 金融 事务 处 理 机 。 

[译注 1」 : 这 里 的 “应 用 ” 尤 指 大 型 应 用 程序 ， 像 办 公 软 件 ， 导 航 软 件 ， 网 页 浏览 右 等 。 这 些 软件 的 使 用 习 
惯 和 开 友 模式 都 很 像 PC 上 的 软件 ， 但 是 基本 上 没有 实时 要 求 。 

@ 款式 R (ARMv7-R) : 硬 实时 且 高 性 能 的 处 理 器 。 标 的 是 高 端 实时 “市场 。 那 些 高 级 的 玩意 ， 
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像 高 档 轿 车 的 组 件 ， 大 型 发 电机 控制 器 ， 机 需 手 臂 控 制 句 等 ， 它 们 使 用 的 处 理 融 不 但 要 很 好 很 
强大 ， 还 要 极其 可 徘 ,， 对 事件 的 反应 也 要 极其 敏捷 。 
@ 蒜 式 MARMv7-M): 认 准 了 旧 世 代 单 片 机 的 应 用 而 量 喘 定制 。 在 这 些 应 用 中 ， 尤 其 是 对 于 实 
时 控制 系统 ， 低 成 本 、 低 功 耗 、 极 速 中 断 反 应 以 及 高 处 理 效 率 ， 都 是 全 关 重 要 的 。 
Cortex 系 列 是 v7 架构 的 第 一 次 甩 相 ， 其 中 Cortex-M3 束 是 按 球 式 M 设 计 的 。 
[ 注 1] : 通用 处 理 占 能 否 胜 任 实时 系统 的 控制 ， 常 遭受 质疑 ， 并 且 在 这 方面 的 争论 从 没 停止 过 。 从 定义 的 角度 讲 ， 
“实时 "就 是 指 系统 必须 在 给 定 的 死 线 (deadline， 亦 称 作 “ 最 后 期 限 ”) 内 做 出 响应 。 在 一 个 以 ARM 处 理 器 为 核心 的 
系统 中 ， 决 定 能 否 达 到 “实时 "这 个 目标 的 ， 有 很 多 因 闵 ， 包 括 是 售 使 用 “实时 操作 系统 "， 中 断 延 民 ， 存 储 需 延 时 ， 
以 及 当时 处 理 需 是 否 在 运行 更 高 优先 级 的 中 断 服 务 例 程 。 



































本 书 认 准 了 Cortex-M3 束 一 独子 扎 下 去 。 到 目前 为 止 ，Cortex-M3 也 是 球 式 M 中 被 抚养 成 人 的 独 
苗 。 其 它 Cortex 家 族 的 处 理 器 包括 款式 A 的 Cortex-A8〈 应 用 处 理 器 ) ， 款 式 R 的 Cortex-R4 (实时 处 理 
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图 1.2 ARM 人 处理 器 架构 进化 史 


ARMv7-M 的 私房 秘密 都 记录 在 《The ARMv7-M Architecture Application Level Reference Manual》 
中 (本 书 也 讲 了 很 多 “System Leve” 的 内 容 一 一 详 注 ) ，ARM 己 经 将 其 公开 。 《Cortex M3 Technical 
Reference Manual》 中 则 记录 了 实现 v7-M 时 的 很 多 细节 和 花 毗 。 为 v7M 中 列 出 的 指令 有 一 些 是 可 
选 的 ， 而 CM3 裁 反 了 一 部 分 ， 所 以 在 这 个 文档 中 重新 列 出 了 被 CM3 文 持 的 指令 集 。 























1.2.1 处 理 器 命名 法 





以 前 ，ARM 使 用 一 种 基于 数学 的 命名 法 。 在 早期 (1990s) ， 还 在 数字 后 面 添加 字母 后 级， 用 来 
进一步 明细 该 处 理 器 支持 的 特性 。 就 拿 ARRM7TDMI 来 说 ，T 代 表 Thumb 指 令 集 ，D 是 说 支持 JTAG 调 试 
(Debugging)，M 意 指 快速 乘法 器 ，| 则 对 应 一 个 租 入 式 ICE 模 块 。 后 来 ， 这 4 项 基本 功能 成 了 任何 狐 产 
品 的 标 配 ， 于 是 就 不 再 使 用 这 4 个 后 级 一 一 相当 于 默许 了 。 但 是 新 的 后 级 不 断 加 入 ， 包括 定义 存储 器 
接口 的 ， 定 义 高 速 缓存 的 ， 以 及 定义 “ 紧 看 合 存储 器 〈TCM)“ 的 ， 于 是 形成 了 新 一 套 命 名 法 ， 这 套 
命名 法 也 是 一 直 在 使 用 的 。 
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表 1.1 _ ARM 处 理 器 名 字 


架构 版 本 号 存储 器 管理 特性 


ARM966H MPU 《可 这 ) 


ARMIONE ve wu mw 


Be 


MPU (可 迄 ) | NVIC 





Cortex-RAF Dsp+ 浮 点 运算 


[译注 2] : Jazelle 是 ARM 处 理 器 的 硬件 Java 加 速 器 。 

[译注 3] : MMU， 存 储 占 管理 单元 ， 用 于 实现 虚拟 内 存 和 内 存 的 分 区 保护 ， 这 是 应 用 处 理 右 与 租 入 式 处 理 器 的 分 
水 岭 。 电 脑 和 数码 产品 所 使 用 的 处 理 占 几乎 清一色 地 都 夺 MMU。 但 是 MMU 也 引入 了 不 确定 性 ， 这 有 时 是 艇 入 式 领 
域 一 一 尤其 是 实时 系统 不 可 接受 的 。 然 而 对 于 安全 关键 (safety-critical) 的 区 入 式 系 统 ， 还 是 不 能 没有 内 存 的 分 区 保 
护 的 。 为 解决 和 矛盾， 于 是 就 有 了 MPU。 可 以 把 MPU 认 为 是 MMU 的 功能 子 集 ， 筷 只 文 持 分 区 保护 ， 不 文 持 具有 “定位 
决定 性 “的 虚拟 内 存 机 制 。 

到 了 架构 7 时 代 ，ARM 改 革 了 一 度 使 用 的 ， 元 长 的 、 需 要 “解码 "的 数字 命名 法 ， 转 到 另 一 种 看 起 
来 比较 整齐 的 命名 法 。 比 如 ，ARMYVv7 的 三 个 和 亚 陈 都 以 Cortex 作 为 主 名 。 这 不 仅 更 加 澄清 并 且 “ 精 钱 ” 
了 所 使 用 的 ARM 架 构 ,， 也 避免 了 新 手 对 架构 号 和 系列 号 的 混 消 。 例 如 ，ARM7TDMI 并 不 是 一 玖 ARMV7 
的 产品 ， 而 是 辉 焊 起 点 一 一 v4T 架 构 的 产品 。 

















1.3 ” 措 令 集 的 友 展 


为 了 增强 和 扩展 指令 系统 的 能 力 而 奋斗 ， 多 少年 来 这 一 直 是 ARM 钢 而 不 舍 的 精神 动力 。 
由 于 历史 原因 (从 ARM7TDMI 开 始 ) ，ARM 处 理 器 一 直 支 持 两 种 形式 上 相对 独立 的 指令 集 ， 它 


们 分 列 是 : 
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@ 32 位 的 ARM 指 令 集 。 对 应 处 理 器 状态 ARM 状 态 

@ 16 位 的 Thumb 指 令 集 。 对 应 处 理 器 状态 : Thumb 状 态 

可 见 ， 这 两 种 指令 集 也 对 应 了 两 种 处 理 器 执行 状态 。 在 程序 的 执行 过 程 中 ， 处 理 器 可 以 动态 地 
在 两 种 执行 状态 之 中 切换 。 实 际 上 ，Thumb 指 令 集 在 功能 上 是 ARM 指 令 集 的 一 个 子 集 ， 但 它 能 带 来 
更 高 的 代码 密度 ， 给 目标 代码 减肥 。 这 对 于 要 勒 紧 裤 腰带 的 应 用 还 是 很 经 济 的 。 














ARM 


Thumb 指 令 集 


问世 [译注 人 


Thumb 





架构 演进 图 
图 1.3 《指令 集 涡 进 图 


译注 1: 原 书 把 Thumb-2 的 问世 时 间 放 到 v7 中 , 但 根据 其 它 权 威 文献 的 记录 , 似 有 误 , 应 在 v6 中 问世 。 
(如 《ARM and Thumb-2 Instruction Set Quick Reference Card》 中 的 摘 述 ) 

随 看 架构 厂 本 号 的 更 新 ， 新 好 指令 不 断 地 加 入 ARM 和 Thumb 指 令 人 集中。 附录 2 中 给 出 的 内 容 ， 惑 
是 Thumb 指 令 在 架构 进化 过 程 中 的 改变 记录 。Thumb-2 是 2003 年 盛夏 的 果实 ， 它 是 Thumb 的 超 集 ， 它 
文 持 both 16 位 和 32 位 指令 。 

§ 令 集 的 详细 说 明 在 《The ARM Architecture Reference Manual》 (简称 为 ARMARM ) 中 。 每 次 

ARM 出 新 版 本 时 此 手册 都 有 更 新 。 到 了 v7 时 ， 因 为 以 前 的 单一 架构 被 分 成 了 3 个 葡 式 ， 这 个 规格 书 也 
怠 跟 着 变 成 了 3 本 。 为 Corex-M3 的 ARMv7-M 架 构 而 写 的 那 本 叫 《ARMv7-M Architecture Application 
Level Reference Manual(Ref2)》 ， 对 于 软件 开发 人 员 ， 那 里 面 把 该 说 的 都 说 了 。 


1.4 Thumb-2 指令 集体 系 体系 结构 ( ISA ) 


Thumb-2 真 不 愧 是 一 个 突破 性 的 指令 集 。 它 强大 , 它 易 用 , 它 轻 供 , 它 高 效 .Thumb-2 是 16 位 Thumb 
指令 集 的 一 个 超 集 ， 在 Thumb-2 中 ，16 位 指令 首次 与 32 位 指令 并 存 ， 结 果 在 Thumb 状 态 下 可 以 做 的 
事情 一 下 子 丰 富 了 许多 ， 同 样 工作 需要 的 指令 周期 数 也 明显 下 降 。 
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波 
tk 











Instruction Set 
(32-bit and 16-bit) 


Cortex-M3 






Thumb 
Instructions 
(16-bit) 





图 1.4 Thumb-2 指 令 集 与 Thumb 指 令 集 的 关系 


从 图 中 可 见 ，Cortex-M3 勇 敢 地 拭 绝 了 32 位 ARM 指 令 集 ， 却 把 自己 的 处 理 能 力 以 身 相 许 般 地 全 托 
给 Thumb-2 指 令 集 。 这 可 能 有 些 令 人 意外 ， 但 事实 上 这 却 见 证 了 Cortex-M3 的 用 情 专 一 : 在 内 核 水 平 
上 上 ， 束 已 经 为 适应 单片机 和 小 内 存 占 件 而 抉择 、 取 舍 过 了 。 但 她 没有 巡 错 即 ， 因为 Thumb-2 完 全 胜 
任 在 这 个 领域 挑大梁 。 不 过 ， 这 也 意味 着 Cortex-M3 作 为 新 生 代 人 处理 器 ,不 是 向 后 兼容 的 。 因 此 ,为 
ARM7 写 的 ARM 汇 编 语 言 程 序 不 能 直接 移植 到 CM3 上 来 。 不 过 , CM3 支 持 绝 大 多 数 传 统 的 Thumb 指 令 ， 
因此 用 Thumb 指 令 写 的 汇编 程序 就 从 善 如 流 了 。 

在 支持 了 both 16 位 和 32 位 指令 之 后 ， 就 无 需 烦 心地 把 处 理 器 状态 在 Thumb 和 ARM 之 间 来 回 的 切 
换 了 。 这 种 事 在 ARM7 和 ARM9 是 司空 见 惯 的 ， 尤 其 是 在 使 用 大 型 条 件 和 衣 套 ， 以 及 执行 复杂 运算 的 时 
候 ， 能 精妙 地 移 形 换 影 于 不 同 状态 之 间 ， 那 可 是 当年 要 成 为 大 虾 的 基本 功 。 

Cortex-M3 是 ARMv7 染 构 的 掌上 明珠 。 和 曾经 红 透 整个 业界 的 老 一 右 ARM7 相 比 ，Cortex-M3 则 是 
新 生 代 的 偶像 ， 处 处 内 潍 着 青春 的 光芒 活力 。 比 如 ， 硬 件 除 法 器 被 带 到 cM3 中 ; 乘法 方面 ， 也 有 好 
几 条 新 指令 闪 之 登场 ， 用 于 提升 data-crunching 的 性 能 。CM3 的 出 现 ， 还 在 ARM 处 理 器 中 人 破 天 元 地 文 
持 了 * 非 对 草 数据 访问 文 持 ”。 






































1.5 “Cortex-M3 处 理 器 的 舞台 


高 性 能 十 高 代码 密度 十 小 硅 片面 积 ，3 壁 合 一 ， 使 得 CM3 大 面积 地 成 为 理想 的 处 理 平台 : 

@ ” 低 成 本 单片机 : CM3 与 生 俱 来 就 适合 做 单片机 ， 其 至 简单 到 用 于 做 玩具 和 小 电器 的 单片机 ， 都 
能 使 用 CM3 作 为 内 核 ,这 里 本 是 8 位 机 和 16 位 机 统治 最 牢固 的 腹地 , 但 是 CM3 更 便宜 , 更 高 性 能 ， 
更 易 使 用 ， 所 以 值得 开发 者 们 转 到 这 个 新 生 的 ARM32 位 系统 中 来 ， 哪 怕 花 点 时 间 重 新 学 习 。 

@ ”汽车 电子 ，CM3 也 是 汽车 电子 的 好 俱 。cCM3 同 时 拥有 非常 高 的 性 能 和 极 低 的 中 断 延 迟 ， 打 入 实 
时 领域 的 大 门 。CM3 处 理 器 能 支持 多 达 240 个 外 部 中 断 ， 内 建 了 峰 套 向 量 中 断 控 制 器 ,还 可 以 选 
择 配 上 一 个 存储 器 保护 单元 (MPU) 。 所 有 这 些 ， 使 它 用 于 高 集成 度 低 成 本 的 汽车 应 用 最 合适 
不 过 了 。 

@ ”数据 通信 : cM3 的 低 成 本 十 高 效率 ， 再 加 上 Thumb-2 的 强大 位 操作 指令 s， 使 cM3 非 常理 想 地 适 
合 于 很 多 数据 通信 应 用 ， 尤 其 是 无 线 数 传 和 Ad-Hoc 网 络 ， 如 zigBee 和 蓝牙 等 。 

@ 工业 控制 ; 在 工控 场合 ， 关 键 的 要 素 在 于 简洁 、 快 速 响应 以 及 可 靠 。 再 一 次 地 ，CM3 处 理 器 的 
中 断 处 理 能 力 ， 低 中 断 延 迟 ， 强 化 的 故障 处 理 能 力 (fault-handing， 以 后 fault 就 不 再 译 成 中 文 了 
一 一 译注 ) ， 足 以 让 它 能 昂首 挺 胸 地 踏 入 这 片 热土。 

@ 消费 类 产品 ， 以往 ， 在 许多 消费 产品 中 ， 都 必须 使 用 一 块 甚至 好 几 块 高 性 能 的 微 处 理 器 。 你 别 
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看 CM3 只 是 个 小 处 理 喜 ， 它 的 高 性 能 和 MPU 机 制 可 是 足以 让 复杂 的 软件 跑 起 来 的 ， 同 时 提供 健 

壮 的 存储 融 你 护 。 

目前 在 市 场 上 已 经 有 了 好 多 基于 Cortex-M3 内 核 的 处 理 占 产品 ， 最 便宜 的 还 不 到 1 关 元 ， 让 ARM 
终于 比 很 多 8 位 机 还 便宜 了 。 








本 书 的 组 织 

Chpt 1 和 2， Cortex-M3 的 介绍 和 概览 

Chpt 3-6, Cortex-M3 的 基础 知识 

Chpt 7-9， 寞 名 与 中 断 

Chpt 10 和 11， 论述 在 Cortex-M3 的 编程 

Chpt 12-14， Cortex-M3 的 硬件 特性 

Chpt 15-16， Cortex-M3 的 调试 文 持 

Chpt 17-20， 在 Cortex-M3 上 的 应 用 软件 开发 
附录 s 


1.6 “深入 研究 用 的 读物 


本 书 并 没有 面面俱到 地 谈 及 Cortex-M3 的 技术 细 和 。 本 书 靠 前 的 章节 用 来 做 Cortex-M3 新 手 的 贡 
门 砖 ， 同 时 也 是 CM3 处 理 占 的 增值 参考 资料 。 如 果 要 进一步 地 学 习 ， 束 需要 从 ARM 网 站 下 载 下 和 面 这 
些 重量 级 的 权威 资料 : 

《The Cortex-M3 Technical Reference Manual》， 深 入 了 处 理 喜 的 内 心 ， 编 程 模型 ， 存 储 器 映射 ， 
还 包括 了 指令 时 序 。 
《” The ARMv7-M Architecture Application Level Reference Manual》 第 2 版 , 对 指令 集 和 存储 器 模型 都 
提供 了 最 不 嫌 崇 的 说 明 。 

其 它 半 导体 广 家 提供 的 ， 基 于 CM3 单 刻 机 的 数据 手册 。 

如 想 了 解 更 多 总 线 协 议 的 细节 ， 可 以 去 看 《AMBA Specification 2.0》 第 4 版 ) , 它 讲 了 更 多 AMBA 
接口 的 内 项。 

对 于 C 程 序 员 ， 可 以 从 《ARM Application Note 179: Cortex-M3 Embedded Software Development》 

《第 7 版 ) 中 得 到 一 些 编程 技巧 和 提示 。 






































本 书 假设 你 已 经 涉足 过 租 入 式 编 程 ， 有 一 些 基本 知识 和 经 验 。 如 果 你 是 位 产品 经 理 或 者 是 想 先 
浅 浅 地 和 莹 一 签 ， 请 先 读 第 2 章 ， 试 大 找 找 感觉 再 决定 要 不 要 深入 和 学习。 这 一 章 浓 缩 了 全 书 的 精华 ， 
走马 观 花 地 讲 了 Cortex-M3 内 核 。 
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Cortex-M3 概览 


内 容 提要 

简介 

寄存 亏 组 
操作 模式 和 特权 极 别 
内 建 的 组 套 癌 量 中 断 控 制 器 
存储 器 映射 

总 线 接口 
存储 器 保护 单元 

I > 
中 断 和 异常 
调试 文 持 


小 结 





2.1 简介 


Cortex-M3 是 一 个 32 位 处 理 融 内 核 。 内 部 的 数据 路 径 是 32 位 的 ， 寄 存 右 是 32 位 的 ， 存 储 器 
接口 也 是 32 位 的 。CM3 采用 了 哈佛 结构 ， 拥 有 独立 的 指令 总 线 和 数据 总 线 ， 可 以 让 取 指 与 数据 访 
间 并 行 不 昼 。 这 样 一 来 数据 访问 不 再 占用 指令 总 线 ， 从 而 提升 了 性 能 。 为 实现 这 个 特性 ， CM3 内 部 
含有 好 几 条 总 线 接口 ， 每 条 都 为 自己 的 应 用 场合 优化 过 ， 并 且 它 们 可 以 并 行 工作 。 但 是 另 一 方面 ， 
指令 总 线 和 数据 总 线 共 享 同一 个 存储 器 空间 〈 一 个 统一 的 存储 器 系统 )。 换 句 话说， 不 是 因为 有 两 
条 总 线 ， 可 寻 址 空间 就 变 成 8GB 了 。 

比较 复杂 的 应 用 可 能 需要 更 多 的 存储 系统 功能 ， 为 此 CM3 提供 一 个 可 选 的 MPU， 而 且 在 需要 的 
情况 下 也 可 以 使 用 外 部 的 cache。 另 外 在 CM3 中 ，Both 小 端 模 式 和 大 端 模 式 都 是 支持 的 。 

CM3 内 部 还 附 赠 了 好 多 调试 组 件 ， 用 于 在 硬件 水 平 上 支持 调试 操作 ， 如 指令 断 点 ， 数 据 观察 点 
等 。 男 外 ， 为 支持 更 高 级 的 调试 ， 还 有 其 它 可 选 组 件 ， 包 括 指 令 跟 踪 和 多 种 类 型 的 调试 接口 。 
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Cortex-IM3 
处 理 器 内 核 系 统 








i. 
. 跟踪 信号 
妈 
避 今 总线 存储 器 保护 单元 
指令 总 线 攻 Ty 大 
调试 信号 
挤 令 存储 颖 存储 器 系统 和 处 设 私有 外 设 
2.1 Cortex-M3 的 一 个 简化 秽 图 
[图 2.1 洲 : 
1. 原文 为 “Debug System”。 但 从 图 中 看 ， 疑 似 有 误 ， 更 像 “Trace System”， 故 改 为 “ 跟 踩 系统 ” 
2. 天 花 板 方块 标示 的 是 可 选 部 分 。 其 中 MPU 全 部 可 选 ， 而 跟踪 系统 与 调试 接口 的 组 件 则 有 一 部 分 是 可 选 的 。 


2.2 ” 寄 仔 器 组 


Cortex-M3 处 理 器 拥有 Re@-R15 的 寄存 器 组 。 其 中 R13 作为 堆栈 指针 SP。SP 有 两 个 ， 但 在 同 
一 时 刻 只 能 有 一 个 可 以 看 到 ， 这 也 就 是 所 谓 的 “banked” 寄 存 器 。 
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力 


习 | | 习 
一 | | 口 


2 
I 


R13 (MSP) 


刁 || 习 
oil 


R13 (PSP) 


通用 寄 仔 器 
通用 寄存 器 
通用 寄存 器 
通用 寄存 器 
通用 寄存器 
通用 寄存 器 
通用 寄存器 
通用 寄 仓 器 
通用 寄 体 器 
通用 寄存 器 
通用 寄存 器 
通用 寄存 器 
通用 寄 体 器 


波 
| 一 
攻 


Low Registers 


High Registers 


主 堆栈 指针 (MSP ) ， 进 程 堆栈 指针 ( PSP ) 


连接 寄存 器 (LR) 
程序 计数 器 (PC) 


2.2.1 Re-R12: 通用 寄存 器 


R6-R12 都 是 32 位 通用 寄存 堪 ， 用 于 数据 操作 。 但 是 注 
问 Re-R7， 而 32 位 Thumb-2 指令 可 以 访问 所 有 寄存 器 。 


2.2.2 Banked R13: 两 个 堆栈 指针 


意 : 绝 大 多 数 16 位 Thumb 指令 只 能 访 


Cortex-M3 拥有 两 个 堆栈 指针 ， 然 而 它们 是 banked， 因 此 任 一 时 刻 只 能 使 用 其 中 的 一 个 。 

@ 主 堆 栈 指 针 (MSP): 复位 后 缺 省 使 用 的 堆栈 指针 , 用 于 操作 系统 内 核 以 及 异 各 处 理 例 程 〈 包 
括 中 断 服务 例 程 ) 

@ 进程 堆栈 指针 (PSP): 由 用 户 的 应 用 程序 代码 使 用 。 


堆栈 指针 的 最 低 两 位 永远 是 6， 这 意味 着 堆栈 总 是 4 字 节 对 齐 的 。 
在 ARM 编程 领域 中 ， 凡 是 打 断 程序 顺序 执行 的 事件 ， 都 被 称 为 异常 (exception)。 除 了 外 部 中 断 外 ， 当 有 指令 

















执行 了 “非法 操作 ”或 者 访问 被 禁 的 内 存 区 间 ， 因 各 种 错误 产生 的 fault， 以 及 不 可 屏 若 中断 发 生 时 ， 都 会 打 断 程 
序 的 执行 ， 这 些 情 况 统称 为 异 亩 。 在 个 严格 的 上 下 文中 ， 异 常 与 中 断 也 可 以 温 用。 为 外 ， 程 序 代码 也 可 以 主动 请 来 
进入 弄 常 状 态 的 (第 用 于 系统 调用 )。 


2.2.3 R14: 连接 寄存 器 














当 呼 叫 一 个 子 程序 时 ， 由 R14 存储 返回 地 址 
不 像 大 多 数 其 它 处 理 器 ，ARM 为 了 减少 访问 内 存 的 次 数 (访问 内 存 的 操作 往往 要 3 个 以 上 指令 周期 ， 带 MMU 和 
cache 的 就 更 加 不 确定 了 )， 把 返回 地 址 直接 存储 在 寄存 器 中 。 这 样 足 以 使 很 多 只 有 41 级 子 程序 调用 的 代码 无 需 访问 
内 存 ( 堆 栈 内 存 )， 从 而 提高 了 子 程序 调用 的 效率 。 如 果 多 于 1 级 ， 则 需要 把 前 一 级 的 R14 值 压 到 堆栈 里 。 在 ARM 
上 编程 时 ， 应 尽量 只 使 用 寄存 器 保存 中 间 结 果 ， 连 不 得 以 时 才 访 问 内 存 。 在 RISC 处 理 器 中 ， 为 了 强调 访 内 操作 越 
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过 了 处 理 器 的 界线 ， 并 且 带 来 了 对 性 能 的 不 利 影响 ， 给 它 取 了 一 个 专业 的 术语 : 溅 出 。 


2.2.4R15: 程序 计数 寄存 器 


指向 当前 的 程序 地 址 。 如 果 修 改 它 的 值 ， 束 能 改变 程序 的 执行 流 很 多 局 级 拉 巧 就 在 这 里 面 一 


一 译注 )。 
2.2.5 特 殊 功 能 寄存 器 


Cortex-M3 还 在 内 核 水 平 上 挫 载 了 在 干 特殊 功能 寄存 器 ， 包 括 
程序 状态 字 寄 存 器 组 (PSRs) 

中 断 屏 蔽 寄存 器 组 (PRIMASK，FAULTMASK，BASEPRI) 

控制 寄存 器 〈CONTROL ) 





| ”xPSR ”| 状态 字 寄存 器 s ( 三 合 一 ) 


中 断 屏 项 特殊 功能 
FAULTMASK 过 存 蝇 5 寄存 器 s 
BASEPRI 


Be 


2.3 : Cortex-M3 中 的 特殊 功能 家 和 存 器 集合 


表 2.1 寄存 器 及 其 功能 


PRIMASK “| 除 能 所 有 的 中 断 一 一 当然 了 ， 不 可 屏蔽 中 断 NMI) 才 不 忆 它 呢 。 





除 能 所 有 优先 级 不 高 于 某 个 具体 数值 的 中 断 。 








第 3 章 对 此 有 展开 的 叙述 。 


2.3 “操作 模式 和 特权 极 别 


Cortex-M3 处 理 器 文 持 两 种 处 理 器 的 操作 模式 ， 还 文 持 两 级 特权 操作 。 
两 种 操作 模式 分 别 为 : 处 理 者 模式 (handler mode， 以 后 不 再 把 handler 中 译 一 一 译注 ) 和 线 


一 一 


程 模式 (thread mode)。3 引 入 两 个 模式 的 本 意 ， 是 用 于 区 别 普 通 应 用 程序 的 代码 和 异常 服务 例 程 
的 代码 一 一 包括 中 断 服 务 例 程 的 代码 。 


Cortex-M3 的 另 一 个 侧面 则 是 特权 的 分 级 





特权 级 和 用 户 级 。 这 可 以 提供 一 种 存储 器 访问 
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的 保护 机 制 ， 使 得 普通 的 用 户 程 序 代码 不 能 意外 地 ， 其 至 是 恶意 地 执行 涉及 到 要 害 的 操作 。 处 理 器 
文 持 两 种 特权 级 ， 这 也 是 一 个 基本 的 安全 模型 。 
译注 :“ 用 户 级 ”其实 是 从 “UsSer 译 来 的 。 有 些 时 候 英 文 文档 也 使 用 术语 “Unprivileged ， 后 者 如 果 直 译 ， 
则 称 为 “非特 权 级 ”"。 为 统一 术语 ， 本 译文 一 律 使 用 “用 户 级 ”。 
特权 级 用 户 级 


异常 handler 的 代码 handler 模 式 错误 的 用 法 


2.4 Cortex-M3 下 的 操作 横 式 和 特权 级 别 














在 CM3 运行 主 应 用 程序 时 《线程 模式 )， 既 可 以 使 用 特权 级 ， 也 可 以 使 用 用 户 级 ; 但 是 卉 第 服 
务 例 程 必须 在 特权 级 下 执行 。 复 位 后 ， 处 理 需 默认 进入 线程 模式 ， 特 权 极 访问 。 在 特权 级 下 ， 程 序 
可 以 访问 所 有 范围 的 存储 左 〈 如 采 有 MPU， 还 要 在 MPU 规定 的 茶 地 之 外 ), 并 且 可 以 执行 所 有 指令 。 

在 特权 级 下 的 程序 可 以 为 押 欲 为 ， 但 也 可 能 会 把 目 己 给 玩 进去 一 一 切换 到 用 户 级 。 一 旦 进入 用 
户 级 ， 再 想 回 来 就 得 走 "法律 程序 ”了 一 一 用 户 级 的 程序 不 能 简 简 单单 地 试图 改写 CONTROL 寄存 露 
束 回 到 特权 级 ， 它 必须 先 “ 申 诉 ” 执行 一 条 系统 调用 指令 (SVC)。 这 会 触发 SVC 异常 ， 然 后 由 异常 
服务 例 程 (通常 是 操作 系统 的 一 部 分 ) 接管 ， 如 末 批 准 了 进入 ， 则 开 币 服务 例 程 修改 CONTROL 寄存 
禹 ， 才 能 在 用 户 级 的 线程 醒 式 下 重新 进入 特权 级 。 

事实 上 ， 从 用 户 级 到 特权 级 的 唯一 途径 束 古 弄 第 : 如 果 在 程序 执行 过 程 中 触发 了 一 个 民利 ， 处 
理 融 总 是 先 切换 入 特权 级 ， 并 且 在 开 利 服务 例 程 执 行 完 毕 退出 时 ， 返 回 先前 的 状态 《也 可 以 手工 指 
定 返 回 的 状态 一 一 详 沪 。 









































复位 
en | 
异常 
返回 
修改 | 
CONTROL 用 户 级 线程 模式 
寄存 器 





2.5 合法 的 操作 模式 转换 图 


通过 引入 特权 级 和 用 户 级 ， 就 能 够 在 便 件 水 平 上 限制 菜 些 不 受信 任 的 或 者 还 没有 调试 好 的 程序 ， 
不 让 它们 随便 地 配置 涉及 要 害 的 寄存 器 , 因而 系统 的 可 对 性 得 到 了 提高 。 进 一 步 地 , 如 采 配 了 MPU， 
它 还 可 以 作为 特权 机 制 的 补充 一 一 保护 关键 的 存储 区 域 不 被 破坏 ， 这 上 坚 区 域 通 负 是 操作 系统 的 区 域 。 
举例 来 说 , 操作 系统 的 内 核 通 音 都 在 特权 级 下 执行 ,所 有 没有 被 MPU 花 反 的 存储 天 都 可 以 访问 。 
在 操作 系统 开 司 了 一 个 用 户 程序 后 ， 通 第 都 会 让 它 在 用 户 级 下 执行 ， 从 而 使 系统 不 会 因 攻 个 程序 的 
衣 沉 或 恶意 破坏 而 受 损 。 
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2.4 ”内 建 的 启 套 向 量 中 断 控 制 器 


Cortex-M3 在 内 核 水 平 上 搭载 了 一 颗 中 断 控 制 器 一 一 般 套 向 量 中 断 控制 器 NVIC(Nested 
Vectored Interrupt Controller)。 和 与 内 核 有 很 深 的 “亲密 接触 ”一 一 与 内 核 是 紧 丰 合 的 。 
NVIC 提供 如 下 的 功能 : 

@ 可 航 套 中 断 文 持 

@ 问 量 中 断 文 持 
@ 动态 优先 级 调整 文 持 
移 
二 











中 断 延迟 大 大 缩短 
中 断 可 屏蔽 


2.4.1 可 峰 套 中 汤 支 持 


可 垦 套 中 断 支 持 的 作用 范围 很 ， 窗 盖 了 所 有 的 外 部 中 断 和 绝 大 多 数 系 统 异常 。 外 在 表现 是 ， 
这 些 弄 弟 都 可 以 被 赋予 不 同 的 优先 级 。 当 前 优先 级 被 存储 在 xPSR 的 专用 字段 中 。 当 一 个 卉 剃 发 生 
时 ， 便 件 会 目 动 比较 该 异 第 的 优先 级 是 否 比 当前 的 异 第 优先 级 更 局 。 如 朵 发 现 来 了 更 局 优先 级 的 弄 
荔 ， 处理 右 束 会 中 靳 当前 的 中 断 服务 例 程 (或 者 是 普通 程序 )， 而 服务 新 来 的 弄 第 一 一 即 并 即 抢占 。 


2.4.2 ” 问 量 中 断 支持 


当 开 始 啊 应 一 个 中 断后 ，CM3 会 目 动 定位 一 张 同 量 表 ， 并 且 根 据 中 断 写 从 表 中 找 出 ISR 的 入 口 
地 址 ， 然 后 路 转 过 去 执行 。 不 需要 像 以 前 的 ARM 那样 ， 由 软件 来 分 状 到 撒 是 哪个 中 断 发 生 了 ， 也 无 
需 半 导体 三 商 提供 私有 的 中 断 控 制 夯 来 完成 这 种 工作 。 这 么 一 来 ， 中 断 延 迟 时 间 大 为 缩短 。 


2.4.3 ”动态 优先 级 调整 支持 


软件 可 以 在 运行 时 期 更 改 中 断 的 优先 级 。 如 来 在 某 ISR 中 修改 了 上 自己 所 对 应 中 靳 的 优先 级 ， 而 
且 这 个 中 断 又 有 新 的 实例 处 于 悬 起 中 〈pending)， 也 不 会 自己 打 断 自己 ， 从 而 没有 重 入 (reentry) 
[译注 7] 风险 。 
[译注 7J: 上 押 博 的 重 入 ， 就 是 指 某 段子 程序 还 没有 执行 冠 ， 就 因为 中 断 或 者 是 多 任务 操作 系统 的 调度 原因 ， 导 致 该 
子 程序 在 一 个 新 的 寄存 器 上 下 文中 被 执行 《请 不 要 把 重 入 与 递归 混 消 ， 和 它们 有 本 质 的 区 别 )。 这 种 情况 第 第 会 阅 出 乱 
子 ， 因 此 有 “可 重 入 性 ”的 研究 。 


2.4.4 “中断 延迟 大 大 缩短 


Cortex-M3 为 了 缩短 中 断 延 迟 ， 引 入 了 好 几 个 新 特性 。 包 括 目 动 的 现场 你 护 和 恢复 ， 以 及 有 其它 
的 措施 ， 用 于 缩短 中 断 仍 套 时 的 ISR 间 延 迟 。 详 情 请 匈 后 面 关 于 “ 咬 尾 中 断 ” 和 “上 晚 到 中 断 ” 的 讲 


2.4.5 ”中断 可 屏蔽 


既 可 以 屏蔽 优先 级 低 于 某 个 闪 值 的 中 断 / 异 第 x¥#zg] (设置 BASEPRI 寄 存 器 ), 也 可 以 全 体 封杀 ( 设 
置 PRIMASK 和 FAULTMASK 寄 存 器 ) 。 这 是 为 了 让 时 间 关 键 〈time-critical) 的 任务 能 在 死 线 
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(deadline， 或 日 最 后 期 限 ) 到 来 前 完成 ， 而 不 被 干扰 。 
[译注 8]: 鉴于 (外 部 ) 中断 的 第 见 性 ， 以 后 译文 中 如 果 没 有 特殊 说 明 ， 几 是 提 人 到“ 寞 常 ”， 均 指 除了 外 部 中 汤 之 
外 的 寞 党 ， 而 使 用 “中 断 ” 来 表示 所 有 外 部 中 靳 一 一 也 就 是 对 于 处 理 器 来 说 是 寞 步 的 中 靳 。 








2.5 ” 仔 储 器 映 届 


总 体 来 说 ，Cortex-M3 支持 4GB 存储 空间 ， 如 图 2.6 所 示 地 被 划分 成 若干 区 域 。 


OxFFFFFPPFPF 服务 于 CM3 的 私房 外 设 ， 
包括 NVIC 寄 存 器 ，MPU 寄 
存 器 以 及 片上 调试 组 件 
OxE0000000 
OxDFFFFFFF 
主要 用 于 扩展 片 外 的 外 设 
lGB External Device ( 像 8051 配 8255 似 的 ) 
OxA0000000 
Ox9FFFFFFF 
用 于 扩展 外 部 存储 器 
lGB External RAM 
Ox60000000 
Ox5FFFFFFF 
ox40000000 。 导 计 四 用 于 片上 外 设 
Ox3FFFFFFF 
0x20000000 di 用 于 片上 静态 RAM 
Ox1FFFFFFF a 代码 区 。 也 可 用 于 存储 局 动 
oxo0000000 ”171<MB ~oce 后 缺 省 的 中 断 向 量 表 








从 图 中 可 见 , 不 像 其 它 的 ARM 架构 ， 它 们 的 存储 右上 映射 由 半导体 厂家 说 了 算 ，Cortex-M3 预先 
定义 好 了 “ 粗 线条 的 ”存储 右上 映射 。 通 过 把 请 上 外 设 的 寄存 右上 映射 到 外 设 区 ， 就 可 以 简单 地 以 访问 
内 存 的 方式 来 访问 这 些 外 设 的 寄存 项， 从 而 控制 外 设 的 工作 。 结 束 ， 刻 上 外 设 可 以 使 用 5 语言 来 操 
作 。 这 种 预定 义 的 映射 天 系 ， 也 使 得 对 访问 速度 可 以 做 高 度 的 优化 ， 而 且 对 于 上 户 上 系统 的 设计 而 言 
更 易 集成 (还 有 一 个 重要 的 , 不 用 每 学 一 种 不 同 的 单 厂 机 束 要 邵 悉 一 种 新 的 存储 此 映 喘 一 一 详 注 )。 

Cortex-M3 的 内 部 拥有 一 个 总 线 基础 设施 ， 专 用 于 优化 对 这 种 存储 帮 结 构 的 使 用 。 在 此 之 上 ， 
CM3 甚至 还 允许 这 些 区 域 之 间 “ 越 权 使 用 ”。 比 如 说 ,数据 存储 器 也 可 以 被 放 到 代码 区 ， 而 且 代 人 码 也 
能 够 在 外 部 RAM 区 中 执行 (但 是 会 变 慢 不 少 一 一 讨 : )。 

处 于 最 高 地 址 的 系统 级 存储 区 ， 是 CM3 用 于 藏 “ 私 房 钱 ”的 一 一 包括 中 断 控 制 磊 、MPU 以 及 各 
种 调试 组 件 。 所 有 这 些 设备 均 使 用 固定 的 地 址 (本 书 第 5 章 讨 论 存储 占 系 统 )。 通 过 把 基础 设施 的 
地 址 定 死 ， 束 至 少 在 内 核 水 平 上 ， 为 应 用 程序 的 移植 扫 消 了 障 但 。 
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2.6 总线 接口 


Cortex-M3 内 部 有 若干 个 总 线 接口 ， 以 使 CM3 能 同时 取 址 和 访 内 《访问 内 存 )， 它 们 是 : 
@ 指令 存储 区 总 线 〈 两 条 ) 

@ 系统 总 线 

@ 私有 外 设 总 线 





有 了 两 条 代码 存储 区 总 线 负责 对 代码 存储 区 的 访问 ， 分 别 是 IT-Code 总 线 和 D-Code 总 线 。 前 者 
用 于 取 指 ， 后 者 用 于 合 表 等 操作 ， 它 们 按 最 佳 执行 速度 进行 优化 。 

系统 总 线 用 于 访问 内 存 和 外 设 ， 禾 兰 的 区 域 包括 SRAM， 片 上 外 设 ， 户 外 RAM， 片 外 扩展 设备 ， 
以 及 系统 级 存储 区 的 部 分 空间 。 

私有 外 设 总 线 负 责 一 部 分 私有 外 设 的 访问 ， 主 要 就 是 访问 调试 组 件 。 它 们 也 在 系统 级 存储 区 。 





2.7 ” 仔 储 器 保护 音 元 ( MPU ) 


Cortex-M3 有 一 个 可 选 的 存储 器 你 护 单元 。 配 上 筷 之 后 ， 就 可 以 对 特权 级 访问 和 用 户 级 访问 分 
别 施加 不 同 的 访问 限制 。 当 检测 到 犯规 (violated) 时 ，MPU 就 会 产生 一 个 fault 异常 ， 可 以 由 
fault 开 弟 的 服务 例 程 来 分 析 该 错误 ， 并 且 在 可 能 时 改正 它 。 

MPU 有 很 多 玩法 。 最 第 见 的 束 古 由 操作 系统 使 用 MPU， 以 使 特权 级 代码 的 数据 ， 包 括 操作 系统 
本 里 的 数据 不 被 其 它 用 户 程 序 弄 坏 。MPU 在 你 护 内 存 时 是 按 区 省 理 的 (“区 ”的 原文 是 region， 以 
后 不 再 中 译 此 名 词 一 一 译注 )。 它 可 以 把 某 些 内 存 region 设置 成 只 读 ， 从 而 避免 了 那里 的 内 容 意 外 
被 更 改 ; 还 可 以 在 多 任务 系统 中 把 不 同 任务 之 间 的 数据 区 隔离 。 一 句 话 ， 它 会 使 铭 入 式 系 统 变 得 更 
加 健壮 ， 更 加 可 上 徘 (很 多 行业 标准 ， 尤 其 是 航空 的 ， 残 规定 了 必须 使 用 MPU 来 行使 保护 职能 一 一 详 
Ds 


2.8 ”指令 集 


Cortex-M3 只 使 用 Thumb-2 指令 集 。 这 是 个 了 不 起 的 突破 ， 因 为 它 允 许 32 位 指令 和 16 位 指 
令 水 乳 交 融 ， 代 码 密度 与 处 理性 能 两 手 抓 ， 两 手 都 便 。 而 且 虽 然 它 很 强大 ， 却 依然 易于 使 用 。 

在 过 去 ， 做 ARM 开发 必须 处 理 好 两 个 状态 。 这 两 个 状态 是 井 水 不 犯 河水 的 ， 它 们 是 : 32 位 的 
ARM 状态 和 16 位 的 Thumb 状态 。 当 处 理 器 在 ARM 状态 下 时 ， 所 有 的 指令 均 是 32 位 的 (哪怕 只 是 
个 ”NOP2” 指 令 )， 此 时 性 能 相当 高 。 而 在 Thumb 状态 下 ， 所 有 的 指令 均 是 16 位 的 ， 人 代码 密 度 提 高 
一 倍 。 不 过 ，thumb 状态 下 的 指令 功能 只 是 ARM 下 的 一 个 子 集 ， 结 果 可 能 需要 更 多 条 的 指令 去 完成 
相同 的 工作 ， 导 致 处 理性 能 下 降 。 

为 了 取长补短 ， 很 多 应 用 程序 都 混合 使 用 ARM 和 Thumb 代码 段 。 然 而， 这 种 混合 使 用 是 有 额外 
开销 (overhead) 的 ， 时 间 上 的 和 衬 间 上 的 都 有 ， 主 要 发 生 在 状态 切换 之 时 。 另 一 方面 ，ARM 代码 
和 Thumb 代码 需要 以 不 同 的 方式 编译 ， 这 也 增加 了 软件 开发 管理 的 复杂 度 。 
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下 二 时 间 上 的 
额外 开销 J 
人 (加 


ARM 状 态 退 
(e.g., BX LR) 


( 32 位 代码 ) 





情急 之 际 的 代码 
在 ARM 态 下 执行 
















Thumb 状 态 
( 16 位 代码 ) 


| 
| 
| 
连接 跳 转 并 
刀 换 状态 的 指令 。 | 

| 

| 






主 程序 代码 
在 Thumb 下 执行 


主 程序 代码 
在 Thumb 下 执行 











| | Time | | 


2.7 在 诸如 ARM7 处 理 器 上 的 状态 切换 模式 败 





伴随 看 Thumb-2 指令 集 的 横 空 出 世 ， 终 于 可 以 在 单一 的 操作 模式 下 搞定 所 有 处 理 了 ， 再 也 没有 
来 回 切 换 的 事 来 烦 你 了 。 事 实 上 ，Cortex-M3 内 核 干脆 都 不 文 持 ARM 指令 ， 中 断 也 在 Thumb 态 下 
处 理 ( 以 前 的 ARM 总 是 在 ARM 状态 下 处 理 所 有 的 中 断 和 有 措 第 )。 这 可 不 是 小 便 秆 ， 它 使 CM3 在 好 几 
个 方面 都 比 传统 的 ARM 处 理 器 更 先进 : 
@ 消灭 了 状态 切换 的 额外 开销 ， 节 省 了 both 执行 时 间 和 指令 空间 。 
@ 不 再 需要 把 源 代码 文件 分 成 按 ARM 编译 的 和 按 Thumb 编译 的 ， 软 件 开发 的 管理 大 大 减负 。 
@ 无 需 再 反复 地 求证 和 测试 : 究竟 该 在 何 时 何 地 切换 到 何 种 状态 下 ， 我 的 程序 才 最 有 效率 。 开 发 
软件 容易 多 了 。 




















不 少 有 趣 和 强大 的 指令 为 Cortex-M3 注入 了 新 鲜 的 青春 血液 ， 下 面 给 出 几 个 例子 : 
@ UBFX, BFI, BFC: 位 段 提 取 ， 位 段 插 入 ， 位 段 清 零 。 文 持 C 位 段 ， 也 简化 了 外 设 寄 存 器 操 











‘Fs 
@ CL7Z, RBIT: 计算 前 导 零 指令 和 位 反 转 指令 。 二 者 组 合 使 用 能 实现 一 些 特技 
@ UDIV, SDIV: 无 从 写 除 法 和 带 符 写 除 法 指令 。 





@  SEV，WFE，WFI: 发 送 事件 ,等 待 事件 以 及 等 竺 中 断 指令 。 用 于 实现 多 处 理 需 之 间 的 任务 同步 ， 
还 可 以 进入 不 同 的 休眠 模式 。 
@ MSR,MRS: 通 癌 禁地 一 一 访问 特殊 功能 寄存 右 。 














因为 CM3 专 情 于 最 新 的 Thumb-2， 旧 的 应 用 程序 需要 移 西 和 重建 。 对 于 大 多 数 C 源 程 序 ， 只 需 
人 简单 地 重新 编译 就 能 重建 ， 沪 编 代 人 码 则 可 能 需要 大 面积 地 修改 和 重 写 ， 才 能 使 用 CM3 的 新 功能 ， 并 
且 融 入 CM3 新 引入 的 统一 汇编 器 框架 (unified assembler framework) 中 。 

请 注意 : CM3 并 不 支持 所 有 的 Thumb-2 指令 ，ARMv7-M 的 规格 书 只 要 求实 现 Thumb-2 的 一 个 
于 集 。 举 例 来 说 ， 协 处 理 器 指令 焉 被 裁 据 了 《可 以 使 用 外 部 的 数据 处 理 引 擎 来 蔡 代 )。CM3 也 没有 实 
现 SIMD 指令 集 。 旧 世代 的 一 些 Thumb 指令 不 再 需要 ， 因 此 也 被 排除 。 不 文 持 指令 还 包括 v6 中 引 
入 的 SETEND 指令 。 如 欲 租 出 一 个 完整 的 指令 列表 ， 可 以 去 看 附录 A。 


2.9 “中断 和 异常 


ARMV7-M 开创 了 一 个 全 新 的 异常 模型 ，CM3 采用 了 它 。 请 你 一 定 要 划 清 界线 : 这 种 异常 模型 跟 
传统 ARM 处 理 嚣 使 用 的 完全 是 两 码 事 。 新 的 异常 模型 “使 能 ”了 非常 高 效 的 异常 处 理 。 它 支持 
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16-4-1=11 种 系统 异常 (保留 了 4+1 个 档 位 )， 外 加 246 个 外 部 中 断 输入 。 在 CM3 中 取消 了 FIQ 的 
概念 (v7 前 的 ARM 都 有 这 个 FIQ， 人 快 中 断 请 求 )， 这 是 因为 有 了 更 新 更 好 的 机 制 一 一 中 断 优先 级 管 
理 以 及 髓 套 中 断 支 持 ， 它 们 被 纳入 CM3 的 中 断 管理 逻辑 中 。 因 此 ， 支 持 峙 套 中 断 的 系统 就 更 容易 实 
现 FIQ。 

CM3 的 所 有 中 断 机 制 都 由 NVIC 实现 。 除 了 支持 246 条 中 断 之 外 ，NVIC 还 支持 16-4-1=11 个 
内 部 异常 源 ， 可 以 实现 fault 管理 机 制 。 结 果 ，CM3 就 有 了 256 个 预定 义 的 异常 类 型 ， 如 表 2.2 
所 示 。 


表 2.2 Cortex-M3 异常 类 型 
































编号 | 类 型 优先 级 “| 简介 

0 N/A N/A 没有 异常 在 运行 

1 复位 -3( 最 高 ) | 复位 

2 NMI 2 不 可 屏 菩 中断 ( 来 目 外 部 NMI 输 入 脚 ) 

3 硬 (hard) fault | -1 所 有 被 除 能 的 fault， 都 将 “上 访 ” 成 硬 fault 


4 MemManage ”可 编程 存储 器 管理 fault ，MPU 访问 犯规 以 及 访问 非法 位 置 


fault 
5 总 线 fault 可 编程 忌 线 错误 ( 预 取 流 产 ( Abort ) 或 数据 流产 ) 


6 用 法 (usage) “可 编程 由 于 程序 错误 导致 的 异常 


Fault 
7-10 | 保留 N/A N/A 
11 SVCall 可 编程 系统 服务 调用 


12 调试 监视 器 可 编程 调试 监视 器 ( 断 点 ， 数 据 观 察 点 ， 或 者 是 外 部 调试 请 求 





13 保留 N/A N/A 

14 PendSV 可 编程 为 系统 设备 而 设 的 “可 悬挂 请 求 ” ( pendable request ) 

15 SysTick 可 编程 ”系统 滴答 定时 器 ( 也 就 是 周期 性 溢出 的 时 基 定 时 器 一 一 译注 ) 
16 IRQ #0 可 编程 ”外 中 断 #0 

17 IRQ #1 可 编程 ”外 中 断 #1 


255 IRQ #239 可 编程 ”外 中 汤 #239 
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昌 然 CM3 是 支持 246 个 外 中 断 的 ， 但 有 具体 使 用 了 多 少 个 是 由 忆 片 生产 商 决 定 。CM3 还 有 一 个 
NMI 〈 不 可 屏蔽 中 断 ) 输入 脚 。 当 它 被 置 为 有 效 (assert) 时 ，NMI 服务 例 程 会 无 条 件 地 执行 。 


2.9b 低 功 耗 与 高 能 效 (r2p0 修订 版 ) 


为 了 使 我 们 的 产品 功 耗 更 低 ， 以 及 能 源 利 用 效率 更 高 ，Cortex-M3 在 设计 时 加 入 了 很 多 针对 性 
的 功能 。 

首先 ， 在 节能 模式 上 ， 它 提供 了 睡眠 模式 和 深度 睡眠 模式 。 必 上 请 以 及 整个 系统 在 设计 时 通过 与 
内 核 的 和 能 模式 相 呼 应 ， 残 可 以 根据 应 用 的 要 求 ， 在 空闲 时 降低 功 耗 。 第 二 ， 它 精练 的 设计 使 得 门 
数 很 低 , 并 且 在 工作 状态 下 电路 的 活动 更 少 , 所 以 CM3 目 己 也 是 “ 喘 先 士 革 ”地 以 身 作 则 了 。 而 且 ， 
由 于 CM3 的 程序 代码 密度 高 ， 程 序 容量 也 可 以 变 得 更 少 ;， 同 时， 再 加 上 它 强 大 的 性 能 减少 了 程序 执 
行 时 间 ， 使 得 系统 能 以 最 快 的 速度 回 到 睡 虐 中 ， 以 前 低 对 能 源 的 用 量 。 综 上 所 述 ，Cortex-M3 的 能 
效 要 高 于 大 多 的 8 位 或 16 位 单片机 。 


2.10 调试 支持 


Cortex-M3 在 内 核 水 平 上 搭载 了 寿 干 种 调试 相关 的 特性 。 最 主要 的 就 是 程序 执行 控制 ,包括 集 

机 (halting)、 单 步 执行 (stepping)、 指 令 断 点 、 数 据 观 察 点 、 寄 存 右 和 存储 右 访 问 、 性 能 速写 
Cprofiling) 以 及 各 种 跟 踩 机制 。 

Cortex-M3 的 调试 系统 基于 ARM 最 新 的 CoreSight 架构 。 不 同 于 以 往 的 ARM 处 理 器 ， 内 核 本 
身 不 再 含有 JTAG 接口 。 取 而 代 之 的 ， 是 CPU 提供 称 为 “调试 访问 接口 (DAP)” 的 总 线 接口 。 通 过 
这 个 总 线 接口 ， 可 以 访问 芯片 的 寄存 器 ， 也 可 以 访问 系统 存储 器 ， 甚 至 是 在 内 核 运行 的 时 候 访 问 ! 
对 此 总 线 接口 的 使 用 ， 是 由 一 个 调试 端口 (DP) 设 备 完 成 的 。DPs 不 属于 CM3 内 核 ， 但 它们 是 在 心 
的 内 部 实现 的 。 目 前 可 用 的 DPs 包括 SWJ-DP( 既 支持 传统 的 JTAG 调试 ， 也 支持 新 的 串 行 线 调试 协 
议 ), 为 一 个 SW-DP 则 去 挥 了 对 JTAG 的 文 持 。 另 外 ,也 可 以 使 用 ARM CoreSignt 产品 家 族 的 JTAG-DP 
模块 。 这 下 束 有 3 个 DPs 可 以 选 了 ， 蕊 片 制 造 商 可 以 从 中 选择 一 个 ， 以 提供 具体 的 调试 接口 (通常 
都 是 选 SWJ -DP)。 

此 外 ，CM3 还 能 挂 载 一 个 所 谓 的 “ 舱 入 式 跟 踪 宏 单元 ETM)”。ETM 可 以 不 断 地 发 出 跟踪 信息 ， 
这 些 信 息 通 过 一 个 被 称 为 “跟踪 端口 接口 单元 CTPIU)” 的 模块 而 送 到 内 核 的 外 部 ， 再 在 芯片 外 面 
使 用 一 个 “跟踪 信息 分 析 仪 ” 就 可 以 把 TIPU 输出 的 “已 执行 指令 信息 ”捕捉 到 ， 并 且 送 给 调试 主 
机 一 一 也 就 是 PC。 

在 Cortex-M3 中 ， 调 试 动作 能 由 一 系列 的 事件 触发 ， 包 括 断 点 ， 数 据 观 察 点 ，fault 条 件 ， 或 
者 是 外 部 调试 请 求 输入 的 信号 。 当 调试 事件 发 生 时 ，Cortex-M3 可 能 会 停机 ， 也 可 能 进入 调试 监视 
器 异 稼 handler。 有 具体 如 何 反 应 ， 则 根据 与 调试 相关 寄存 器 的 配置 。 

与 调试 相关 的 还 有 其 它 的 绝活 。 现 在 要 介绍 的 是 “仪器 化 跟踪 宏和 单元 (ITM)” 人 它 也 有 自己 的 
办 法 把 数据 送 往 调试 器 。 通 过 把 数据 写 到 ITM 的 寄存 器 中 ,调试 器 能 够 通过 跟 踩 接口 来 收集 这 些 数 
据 ， 并 且 显 示 或 者 处 理 它 。 此 法 不 但 容易 使 用 ， 而 且 比 JTAG 的 输出 速度 更 快 。 

所 有 这 些 调试 组 件 都 可 以 由 DAP 总 线 接 口 来 控制 ，CM3 内 核 提 供 DAP 接口 。 此 外 ， 运 行 中 的 程 
序 也 能 控制 它们 。 所 有 的 跟踪 信息 都 能 通过 TPIU 来 访问 到 。 
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2.11 Cortex-M3 的 品 性 简 评 





讲 了 这 么 多 ， 究 竟 是 拥有 了 什么 ， 使 Cortex-M3 成 为 如 此 有 突破 性 的 新 生 代 处 理 器 ? 
Cortex-M3 到 底 在 哪里 先进 了 ? 本 下 就 给 出 一 个 小 小 的 简 评 。 


2.11.1 高 性 能 


@ 许多 指令 都 是 单 周期 的 一 包括 乘法 相关 指令 。 并 且 从 整体 性 能 上 ，Cortex-M3 比 得 过 绝 
大 多 数 其 它 的 架构 。 

@ 指令 忆 线 和 数据 总 线 被 分 开 ， 取 值 和 访 内 可 以 并 行 不 怪 
Thumb-2 的 到 来 告别 了 状态 切换 的 旧 世 代 ， 再 也 不 需要 化 时 间 来 切换 于 32 位 ARM 状态 和 
16 位 Thumb 状态 之 间 了 。 这 简化 了 软件 开发 和 代码 维护 ， 使 产品 面市 更 快 。 

@ Thumb-2 指令 集 为 编程 带 来 了 更 多 的 灵活 性 。 许 多 数据 操作 现在 能 用 更 短 的 代码 摘 定 ， 这 
意味 看 Cortex-M3 的 代码 密度 更 局 ， 也 区 对 存储 右 的 需求 更 少 。 

@ 取 指 者 按 32 位 处 理 。 同 一 周期 最 多 可 以 取出 两 条 指令 ， 留 下 了 更 多 的 带宽 给 数据 传输 。 

@ Cortex-M3 的 设计 允许 单片机 高 频 运行 (现代 半导体 制造 技术 能 保证 1686MHz 以 上 的 速度 )。 
即使 在 相同 的 速度 下 运行 ，CM3 的 每 指令 周期 数 (CPI) 也 更 低 ， 于 是 同样 的 MHz 下 可 以 做 
更 多 的 工作 ; 万 一 方面 ， 也 使 同一 个 应 用 在 CM3 上 需要 更 低 的 主 频 。 


2.11.2 先进 的 中 断 处 理 功能 


@ 内 建 的 藤 套 癌 量 中 断 控制 器 支持 多 达 246 条 外 部 中 断 输 入 。 辐 量化 的 中 断 功能 剧烈 地 缩短 
了 中 断 延 运 ， 因 为 不 再 需要 软件 去 判断 中 断 源 。 中 断 的 骸 套 也 是 在 人 硬件 水 平 上 实现 的 ， 不 
需要 软件 代码 来 实现 。 

@ Cortex-M3 在 进入 异 利 服务 例 程 时 ， 目 动 压 栈 了 R8@-R3，R12，LR，PSR 和 PC， 并 且 在 
返回 时 自动 弹出 它们 ， 这 多 清 碍 ! 既 加 速 了 中 断 的 啊 应 ， 也 再 不 需要 汇编 语言 代码 了 《第 
8 章 有 详 述 )。 

@  NVIC 文 持 对 每 一 路 中 断 设 置 不 同 的 优先 级 , 使 得 中 断 管 理 极 富 弹性 。 最 粗 线条 的 实现 也 全 
少 要 支持 8 级 优先 级 ， 而 且 还 能 动态 地 被 修改 。 

@ 优化 中 断 啊 应 还 有 两 招 ， 它 们 分 别 是 “ 咬 尾 中 断 机 制 ” 和 “ 晚 到 中 断 机 制 ” 

有 些 需 要 较 多 周期 才能 执行 完 的 指令 ， 是 可 以 被 中 断 一 继续 的 一 一 束 好 比 它们 是 一 串 指 令 
一 样 。 这 些 指令 包括 加 载 多 个 寄存 器 (LDM)， 存 储 多 个 寄存 器 (STM)， 多 个 寄存 器 参与 的 
PUSH， 以 及 多 个 寄存 器 参与 的 POP。 

@ 除非 系统 被 彻底 地 锁定 ，NMI〈 不 可 屏蔽 中 断 ) 会 在 收 到 请 求 的 第 一 时 间 了 予以 啊 应 。 对 于 
很 多 安全 -关键 (safety-critical) 的 应 用 ，NMI 都 是 必 不 可 少 的 〈 如 化 学 反应 即将 失控 
时 的 紧急 停机 )。 


2.11.3 低 功 耗 


@ Cortex-M3 需要 的 饮 辑 门 数 少 ， 所 以 先天 际 适合 低 功 耗 要 求 的 应 用 《功率 低 于 6.19mW/MHz) 
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在 内 核 水 平 上 支持 节能 模式 (SLEEPING 和 SLEEPDEEP 位 )。 通 过 使 用 “等 竺 中断 指令 (WFI)” 
和 “等 待 事件 指令 CNFE)” 内 核 可 以 进入 睡眠 模式 ， 并 且 以 不 同 的 方式 唤醒 。 另 外 ， 模 块 的 
时 钟 是 尽 可 能 地 分 开 供 应 的 ， 所 以 在 睡眠 时 可 以 把 CM3 的 大 多 数 “ 官 能 团 ” 给 停 掉 。 

CM3 的 设计 是 全 静态 的 、 同 步 的 、 可 综合 的 。 任 何 低 功 耗 的 或 是 标准 的 半导体 工艺 均 可 放心 饮 
用 。 











2.11.4 系统 特性 


| 





系统 文 持 “ 位 寻 址 市 ”操作 〈8651 位 寻 址 机 制 的 “威力 大 幅 加 强 厂 7， 孚 节 不 变 的 大 端 模 陈 ， 
并 且 文 持 非 对 齐 的 数据 访问 。 

拥有 先进 的 fault 处 理 机 制 ， 支 持 多 种 类 型 的 弄 剃 和 faults， 使 故障 诊断 更 容易 。 

通过 引入 banked 堆栈 指针 机 制 ， 把 系统 程序 使 用 的 堆栈 和 用 户 程 序 使 用 的 堆栈 划 清 界线 。 如 
宁 骨 配 上 可 选 的 MPU， 处 理 融 就 能 彻 慌 满足 对 软件 健壮 性 和 可 徘 性 有 严格 要 求 的 应 用 。 











.11.5 调试 支持 











在 支持 传统 的 JTAG 基础 上 ， 还 支持 更 新 更 好 的 串 行 线 调 试 接口 。 

基于 CoreSight 调试 解决 方案 ,使 得 处 理 器 哪怕 是 在 运行 时 , 也 能 访问 处 理 器 状态 和 存储 器 内 
全 

内 建 了 对 多 达 6 个 断 点 和 4 个 数据 观察 点 的 支持 。 

可 以 选 配 一 个 ETM， 用 于 指令 跟 踊 。 数 据 的 跟 踊 可 以 使 用 DWT 

在 调试 方面 还 加 入 了 以 下 的 新 特性 ， 包 括 fault 状态 寄存 器 ， 新 的 fault 异常 ， 以 及 闪存 修 
从 《patch) 操作 ， 使 得 调试 大 幅 人 简化 。 

可 选 ITM 模块 ， 测 试 代码 可 以 通过 它 输 出 调试 信息 ， 而 且 “ 擒 包 即 可 入 住 ” 般 地 方便 使 用 。 
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Cortex-M3 基础 


寄存 做 组 

特殊 功能 寄存 需 组 
操作 模式 
异常 和 中 靳 
器 量 表 
存储 磊 保 护 单元 
堆栈 区 的 操作 
复位 序列 





3.1 ” 寡 和 仔 器 组 


如 我 们 所 见 , CM3 拥有 通用 寄存 器 R86-R15 以 及 一 些 特 殊 功 能 寄存 器 。R8-R12 是 最 “通用 目的 ” 
的 ， 但 是 绝 大 多 数 的 16 位 指令 只 能 使 用 Re-R7“〔〈 低 组 寄存 器 )， 而 32 位 的 Thumb-2 指令 则 可 以 访 
问 所 有 通用 寄存 器 。 特 殊 功 能 寄存 器 有 预定 义 的 功能 ， 而 且 必 须 通过 专用 的 指令 来 访问 。 


3.1.1 通用 目的 寄存 器 R@-R7 


Re-R7 也 被 称 为 低 组 寄存 器 。 所 有 指令 都 能 访问 它们 。 它 们 的 字 长 全 是 32 位 ， 复 位 后 的 初始 
值 是 不 可 预料 的 。 
3.1.2 通用 目的 寄存 器 R8-R12 


R8-R12 也 被 称 为 高 组 寄存 器 。 这 是 因为 只 有 很 少 的 16 位 Thumb 指令 能 访问 它们 ，32 位 的 
thumb-2 指令 则 不 受 限制 。 它 们 也 是 32 位 字 长 ， 且 复位 后 的 初始 值 是 不 可 预料 的 。 
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特殊 功能 寄存 器 : 


状态 字 寄 存 器 s ( 三 合 一 ) 
PRIMASK 
中 断 屏 蔽 特殊 功能 
FAULTMASK 言 存 蝇 s 寄存 吕 s 
BASEPRI 
CONTROL “| 控制 寄存 器 


3.1 Cortex-M3 的 寄存 器 组 


3.1.4 堆栈 指针 R13 


R13 是 堆栈 指针 。 在 CM3 处 理 器 内 核 中 共有 两 个 堆栈 指针 , 于 是 也 就 支持 两 个 堆栈 。 当 引用 R13 
(或 写作 SP) 时 ， 引 用 到 的 是 当前 正在 使 用 的 那 一 个 ， 另 一 个 必须 用 特殊 的 指令 来 访问 (MRS ,MSR 
和 令 )。 这 两 个 堆栈 指针 分 别 是 : 
@ 主 堆 栈 指针 ( MSP ) ， 或 写作 SP_main。 这 是 缺 省 的 堆栈 指针 ， 它 由 0S 内 核 、 异 常服 务 例 程 
以 及 所 有 需要 特权 访问 的 应 用 程序 代码 来 使 用 。 
e@e ”进程 堆栈 指针 ( PSP ) ,或 写作 SP_process。 用 于 常规 的 应 用 程序 代码 〈 不 处 于 异常 服用 例 
程 中 时 )。 
译注 : 在 本 半 中 ， 如 无 特殊 说 明 ,“ 异 常 ” 与 “中 汤 ” 都 是 指 当 发 生 “ 事 件 ” 时 ， 处 理 器 改变 正常 执行 流 ， 去 
啊 应 该 事件 的 情况 。 只 不 过 异常 之 于 处 理 器 是 同步 的 ， 中 汤 之 于 处 理 器 是 异步 的 。 因 此 和 常 混合 使 用 二 术语 ，ISR 和 
ESR 也 混合 使 用 ， 请 读者 不 必 工 于 辨 机 这 两 个 术语 的 不 同 ， 在 这 里 这 不 是 重点 。 


要 注意 的 是 ， 并 不 是 每 个 程序 都 要 用 齐 两 个 堆栈 指针 才 算 圆满 。 仙 单 的 应 用 程序 只 使 用 MSP 就 
36 












































Cortex-M3 权威 指南 第 3 章 





够 了 。 堆 栈 指针 用 于 访问 堆栈 ， 并 且 PUSH 指令 和 POP 指令 默认 使 用 SP。 


堆栈 的 PUSH 与 POP 


堆栈 是 一 种 存储 器 的 使 用 模型 。 它 由 一 块 连续 的 内 存 和 一 个 栈 顶 指针 组 成 ， 用 于 实 
现 “ 后 进 先 出 ”的 缓冲 区 。 其 最 典型 的 应 用 ， 就 是 在 数据 处 理 前 先 保 存 寄存 器 的 值 ， 再 
在 处 理 任务 完成 后 从 中 恢复 先前 保护 的 这 些 值 。 
用 于 备份 寄存 器 当前 值 通过 POP 操作 来 恢复 
的 堆栈 PUSH 操作 先前 备份 过 的 寄存 器 数值 
寄存 器 
= 数据 处 理 
( 原先 寄存 器 
的 值 被 毁坏 ) 


1.2 堆栈 内 存 的 基本 概念 
在 执行 PUSH 和 POP 操作 时 ， 那 个 通常 被 称 为 SP 的 地 址 寄存 器 ， 会 由 硬件 自动 调 
整 它 的 值 ， 以 避免 后 续 操 作 破 坏 先 前 的 数据 。 本 书 的 后 续 章 节 还 要 围绕 着 堆栈 展开 更 详 
细 的 论述 。 








在 Cortex-M3 中 ， 有 专门 的 指令 负责 堆栈 操作 一 一 PUSH 和 POP。 它 俩 的 汇编 语言 语法 如 下 例 所 
演示 

PUSH {RO0} ; *(--R13)=R0。R13 是 long* 的 指针 

POP {RO} ; RO= *R13++ 

请 注意 后 面 C 程序 风格 的 注释 ， 它 诠释 了 所 谓 的 “ 同 下 生长 的 满 栈 ”( 本 章 后 面 在 讲 到 堆栈 内 
存 操作 时 还 要 展开 论述 )，Cortex-M3 束 是 以 这 种 方式 使 用 堆栈 的 。 因 此 ， 在 PUSH 新 数据 时 ， 堆 栈 
指针 先 减 一 个 单元 。 通 党 在 进入 一 个 子 程 序 后 ， 第 一 件 事 束 是 把 寄存 器 的 值 先 PUSH 入 堆栈 中 ， 在 
子 程序 退出 前 再 POP 曾经 PUSH 的 那些 寄存 器 。 另 外 ，PUSH 和 POP 还 能 一 次 操作 多 个 寄存 器 ， 如 下 

















所 示 : 

subroutine 1 
PUSH {RO0O-R7, R12, R14} ; 保存 吉 存 器 列表 
.. ; 执行 处 理 
BOB (RO-R7, &12, Rl ; 恢复 寄存 器 列表 
BX R14 ; 返回 到 主 调 函 数 


在 程序 中 为 了 突出 重点 ， 可 以 一 直 把 R13 写作 SP。 在 程序 代码 中 ，both MSP 和 PSP 都 被 称 为 
R13/SP。 不 过 ， 我 们 可 以 通过 MRS/MSR 指令 来 指名 道 姓 地 访问 具体 的 堆栈 指针 。 

MSP， 亦 写作 SP_main, 这 是 复位 后 缺 省 使 用 堆栈 指针 ， 服务 于 操作 系统 内 核 和 异常 服务 例 程 ; 
而 PSP， 亦 写作 SP_process， 典 型 地 用 于 普通 的 用 户 线 程 中 。 
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寄存 器 的 PUSH 和 POP 操作 永远 都 是 4 字 币 对 齐 的 一 一 也 束 是 说 他 们 的 地 址 必须 是 
Ox4,0x8,0xc,……… 。 事 实 上 ，R13 的 最 低 两 位 被 便 线 连接 到 0, 并 日 总 是 读 出 0 (Read As Zero)。 


3.1.5 ”连接 寄存 器 R14 


R14 是 连接 寄存 器 (LR)。 在 一 个 汇编 程序 中 ， 你 可 以 把 它 写 作 both LR 和 R14。LR 用 于 在 调用 
子 程序 时 存储 返回 地 址 。 例 如 ， 当 你 在 使 用 BL( 分 文 并 连接 ，Branch and Link) 指 令 时 ,就 目 动 填充 LR 
打住。 








malDn 主 程序 


BL functionl ; 使 用 “分 文 并 连接 ”指令 呼叫 functionl 
; PC= functionl1， 并 日 LR=main 的 下 一 条 指令 地 址 


Eunctionl 

; functionl 的 代码 
函数 返回 (如 果 functionl 要 使 用 LR， 必须 在 使 用 前 PUSH， 
侍 则 返回 时 程序 残 可 能 跑 飞 了 一 一 译注) 


BX LR 


we 








we 














尽管 PC 的 LSB 忌 是 0( 因 为 代码 全 少 是 字 对 章 的 )，LR 的 LSB 却 是 可 读 可 写 的 。 这 是 历史 遗留 
的 产物 。 在 以 前 ， 由 位 0 来 指示 ARM/Thumb 状态 。 因 为 其 它 有 些 ARM 处 理 器 支持 ARM 和 Thumb 
状态 并 存 ， 为 了 方便 汇编 程序 移植 ，CM3 需要 允许 LSB 可 读 可 写 。 


3.1.6 ”程序 计数 器 R15 


R15 是 程序 计数 器 ， 在 汇编 代码 中 一 般 我 们 都 都 叫 它 的 外 号 “PC”。 因 49 CM3 内 部 使 用 了 指令 
流水 线 ， 读 PC 时 返回 的 值 是 当前 指令 的 地 址 +4。 比 如 说 ; 

















OUX1L000 : MOV RO, PC ; RO = 0xXx1L004 








如 果 向 PC 中 写 数 据 ， 就 会 引起 一 次 程序 的 分 文 〈 但 是 不 更 新 LR 寄 仔 器 )。CM3 中 的 指令 全 少 
是 半 字 对 草 的 ， 所 以 PC 的 LSB 总 是 读 回 0。 然 而 ， 在 分 文 时 ， 无 论 是 直接 写 PC 的 全 还 是 使 用 分 叉 
指令 ， 都 必须 保证 加 载 到 PC 的 数值 是 奇数 ( 即 LSB=1 ), 用 以 表明 这 是 在 Thumb 状态 下 执行 。 倍 
若 写 了 0， 则 视 为 企图 转 入 ARM 模式 ，CM3 将 产生 一 个 fault 异 单 。 


3.2 ”特殊 功能 寄 仔 器 组 


Cortex-M3 中 的 特殊 功能 寄存 器 包括 : 

@ 程序 状态 寄存 器 组 (PSRs 或 日 xPSR ) 

@ 中 断 屏 普 寄 存 器 组 (PRIMASK, FAULTMASK ， 以 及 BASEPRI ) 

@ 控制 寄存 器 (CONTROL ) 

它们 只 能 被 专用 的 MSR/MRS 指令 访问 ， 而 且 它 们 也 没有 与 之 相关 联 的 访问 地 址 。 


和 已 去 


<gp_reg>, <special_reg> 7 读 特 丈 功 能 寄存 器 的 值 到 通用 寄存 器 
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MSR <special_reg>, <gp_reg> ; 写 通用 寄存 器 的 值 到 特殊 功能 寄存 占 


3.2.1 程序 状态 寄存 器 (PSRs 或 日 PSR ) 


程序 状态 寄存 器 在 其 内 部 又 被 分 为 三 个 子 状 态 寄 存 器 : 

@ 应 用 程序 PSR (APSR ) 

@ ”中断 号 PSR (IPSR) 

@ 执行 PSR (EPSR) 

通过 pi 指令 ， 这 3 个 PSRs 即 可 以 单独 访问 ， 也 可 以 组 合 访问 〈2 个 组 合 ，3 个 组 合 都 





凤 以 7s 当 使 用 至 一 的 方式 访问 时 ， 应 使 用 名 字 “xPSR” 或 者 “PSR”。 


一 s E 9lel7lelslso 


IPSR xeeption Number Number 


3.3 ”Cortex-M3 中 的 程序 状态 寄存 器 (xPSR) 


加 OOo 
eel oom] | | em] [ew 


图 3.4 合体 后 的 程序 状态 寄存 器 (xPSR) 














3.2.2 PRIMASK, FAULTMASK 和 BASEPRI 
这 三 个 寄存 占用 于 控制 异常 的 使 能 和 除 能 
表 3.2 ”Cortex-M3 的 屏蔽 寄存 器 组 
功能 描述 
这 是 个 只 有 单一 比特 的 寄存 器 。 在 它 被 置 1 后 ， 就 关 掉 所 有 可 屏蔽 的 异常 ， 只 剩 
下 NMI 和 便 fault 可 以 啊 应 。 它 的 缺 省 值 是 0， 表 示 没 有 关中 断 。 


FAULTMASK | 这 是 个 只 有 1 个 位 的 寄存 器 。 当 它 置 1 时 ， 只 有 NMI 才能 啊 应 ， 所 有 其 它 的 异常， 
其 至 是 硬 fault， 也 通通 闭 嘴 。 它 的 缺 省 值 也 是 0， 表示 没有 关 异 浓 。 

















BASEPRI 这 个 寄存 器 最 多 有 9 位 〈 由 表达 优先 级 的 位 数 决定 )。 它 定义 了 被 屏蔽 优先 级 的 阔 
值 。 当 它 被 设 成 某 个 值 后 ， 所 有 优先 级 号 大 于 等 于 此 值 的 中 断 都 被 关 〈 优 先 级 号 
越 大 ， 优 先 级 越 低 )。 但 若 被 设 成 0， 则 不 关闭 任何 中 断 ，0 也 是 缺 省 值 。 
对 于 时 间 - 关 键 任务 而 言 , 恰如其分 地 使 用 PRIMASK 和 BASEPRI 来 暂时 关闭 一 些 中 断 是 非常 重要 
的 而 FAULTMASK 则 可 以 被 0S 用 于 暂时 关闭 fault 处理 机 能 , 这 种 处 理 在 作 个 任务 骨 尝 时 可 能 需要 。 




















因为 在 任务 朋 沉 时， 党 沼 伴 随 看 一 大 堆 faults。 在 系统 料理 “后 事 ” 时 ,通常 不 再 知 要 啊 应 这 些 fault 
一 一 人 死 帐 清 。 总 之 FAULTMASK 就 是 专门 留 给 0S 用 的 。 








要 访问 PRIMASK, FAULTMASK 以 及 BASEPRI， 同 样 要 使 用 MRS/MSR 指令 ,如 : 
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MRS RO, BASEPRI ; 读 取 BASEPRI 到 RO0 中 
MRS R00 FAULTMASK 以. 上 
MRS RO, PRIMASK A 
MSR BASEPRI, RO ; 写 入 RO0 到 BASEPRI 中 
MSR FAULTMASK, RO ; 似 上 
MSR PRIMASK, RO ; 似 上 上 

只 有 在 特权 级 下 ， 才 允许 访问 这 3 个 寄存 占 。 


译 者 添加 : 
其 实 ， 为 了 快速 地 开关 中 断 ，CM3 还 专门 设置 了 一 条 CPS 指令 ， 有 4 种 用 法 
CPSID I PRIMASK=1, ; 关中 断 


CPSIE I ;PRIMASK=0,， ; 开 中 断 
CPSID 了 上 ;FAULTMASK=1, ; 关 异 常 
上 上 


CPSIE ; FAULTMASK=0 ; 开 异 常 





3.2.3 ”控制 寄存 旧 (CONTROL) 

控制 寄存 器 有 两 个 用 途 ， 其 一 用 于 定义 特权 级 别 ， 其 二 用 于 选择 当前 使 用 哪个 堆栈 指针 。 由 两 个 比 
特 来 行使 这 两 个 职能 。 

表 3.3 Cortex-M3 的 CONTROL 寄存 器 





CONTROL[0] ，0= 特 权 级 的 线程 模式 


1= 用 户 级 的 线程 模式 


Handler 模式 永远 都 是 特权 级 的 。 





CONTROL[1] 

在 Cortex-M3 的 handler 模式 中 ，CONTROL[1] 总 是 0。 在 线程 模式 中 则 可 以 为 0 或 1。 

因此 ， 仪 当 处 于 特权 级 的 线程 模式 下 ， 此 位 才 可 写 ， 其 它 场 合 下 禁止 写 此 位 。 改 变 处 理 占 的 模 
式 也 有 其 它 的 方式 : 在 异常 返回 时 ， 通 过 修改 LR 的 位 2， 也 能 实现 模式 切换 。 这 是 LR 在 异常 返回 
时 的 特殊 用 法 ， 颠 履 了 对 LR 的 传统 使 用 方式 ， 将 在 第 5 章 中 展开 论述 。 
CONTROL [6 ] 

仅 当 在 特权 级 下 操作 时 才 人 允许 写 该 位 。 一 旦 进入 了 用 户 级 ， 唯 一 返回 特权 级 的 途径 ， 就 是 触发 
一 个 ( 软 ) 中 断 ， 再 由 服务 例 程 改写 该 位 。 
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CONTROL 寄存 器 也 是 通过 MRS 和 MSR 指令 来 操作 的 : 
MRS RO, CONTROL 
MSR CONTROL, RO 


3.3 ”操作 模式 


Cortex-M3 文 持 2 个 模式 和 两 个 特权 等 级 。 


特权 级 用 户 级 
异常 handler 的 代码 错误 的 用 法 
主 应 用 程序 的 代码 





3.6 ”操作 模式 和 特权 等 级 


当 处 理 需 处 在 线程 状态 下 时 ， 既 可 以 使 用 特权 级 ， 也 可 以 使 用 用 户 级 ; 另 一 方面 ，handler 模式 
总 是 特权 级 的 。 在 复位 后 ， 处 理 器 进入 线程 模式 十 特权 级 。 

在 线程 模式 十 用 户 级 下 ， 对 系统 控制 空间 〈SCs) 的 访问 将 被 阻止 一 一 该 空间 包含 了 配置 寄存 器 
组 以 及 调试 组 件 的 寄存 亏 组 。 除 此 之 外 ， 还 花 止 使 用 MRS/MSR 访问 刚才 讲 到 的 ， 除 了 APSR 之 外 的 
特殊 功能 寄存 项 。 如 采 以 吴 试 法 ， 则 对 于 访问 特殊 功能 寄存 右 的 ， 访 问 操作 被 忽略 ; 而 对 于 访问 SCS 
守则 的 ， 将 fault 伺候 。 

译注 : 原文 的 意思 是 越权 访问 一 律 产 生 fault( If a program running at the user access level tries 








to access SCS or special registers, a fault exception will occur)。 但 译 者 使 用 Keil MDK 开 发 环境 
的 模拟 器 和 STM32 单片机 作 实 验 时 却 发 现 ， 对 特殊 功能 寄存 器 越权 访问 时 ， 仅 忽略 访问 操作 ， 并 不 产生 fault。 惫 
外 ， 译 者 发 现 ， 当 使 用 模拟 器 时 ， 即 使 访问 了 SCS 中 的 地 址 ( 译 者 使 用 的 地 址 是 8XE6866E166) ， 模 拟 器 竟然 也 允许 
读 写 ! 后 来 译 者 又 使 用 STM32 单片机 来 实验 ，STM32 单片机 则 的 确 产生 了 总 线 fault 并 上 访 成 了 硬 fault。 因 此 ， 如 
果 使 用 指令 模拟 器 ， 则 要 小 心 。 附 : 译 者 使 用 的 MDK 版 本 号 是 3.26 

在 特权 级 下 的 代码 可 以 通过 置 位 CONTROL[0] 来 进入 用 户 级 ,而 不 管 是 任何 原因 产生 了 任何 腊 沼 ， 
处 理 右 都 将 以 特权 级 来 运行 其 服务 例 程 ， 弄 党 返回 后 ， 系 统 将 回 到 产生 噶 第 时 所 处 的 级 别 。 用 户 级 
下 的 代码 不 能 再 试图 修改 CONTROL[0] 来 回 到 特权 级 。 它 必须 通过 一 个 异 第 handler， 由 那个 异 第 
handler 来 修改 CONTROL[0]， 才 能 在 返回 到 线程 模式 后 拿 到 特权 级 。 


重新 编程 CONTROL 寄 存 器 
务 例 程 


务 例 程 











特权 级 通过 写 CONTROL 寄 
handler 模 式 存 器 切换 到 用 户 级 







特权 级 。 [二 一 特权 级 
点 程 术 式 【局 
用 户 级 

线程 模式 


3.7 ”特权 级 和 处 理 器 模式 转换 图 


把 代码 按 特权 级 和 用 户 极 分 开 对 等 ， 有 利于 使 CM3 的 架构 更 加 安全 和 健壮 。 例 如 ， 当 某 个 用 户 
程序 代码 出 问题 时 ， 不 会 让 它 成 为 害 群 乙 马 ， 因 为 用 户 级 的 代码 是 茶 止 号 特殊 功能 寄存 左 和 NVIC 
中 和 轩 存 各 的 。 为 外 ， 如 果 还 配 有 MPU， 你 护 力度 束 更 大 ， 其 全 可 以 阻止 用 尸 代码 访问 不 属于 它 的 内 
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人 存 区 域 。 
为 了 避免 系统 堆栈 因应 用 程序 的 钳 误 使 用 而 毁坏 ， 我 们 可 以 给 应 用 程序 专门 配 一 个 堆栈 ， 不 让 
它 共 至 操作 系统 内 核 的 堆栈 。 在 这 个 管理 制度 下 ， 运 行 在 线程 模式 的 用 户 代 码 使 用 PSP， 而 腊 常 服 
































第 8 章 将 详细 讨论 此 主题 。 
如 前 所 述 ， 特 权 等 级 和 堆栈 指针 的 选择 均 由 CONTROL 负责 。 当 CONTROL[0]=0 时 ， 在 异常 处 理 
的 始末 ， 只 发 生 了 处 理 器 模式 的 转换 ， 如 下 图 所 示 。 





中 断 返回 
| 

中 断 事件 1。 中断 服 务 例 程 (SR) vy 
| 
| 


主 程序 YN A 








| 入 栈 出 栈 ， 
| 
Time 
线程 模式 | ”Handler 模 式 | 线程 模式 
( 特权 级 ) (特权 级 ) 1 (特权 级 ) 


3.8 ”中 断 前 后 的 状态 转换 





但 若 CONTROL[0]=1《〈 线 程 模式 + 用 户 级 )， 则 在 中 断 响应 的 始末 ，both 处 理 器 模式 和 特权 等 极 
都 要 发 生变 化 ， 如 下 图 所 示 。 
中 断 返 回 


中 断 服 务 例 程 (LSR) vy 


主 和 Y 人 从 








- | 入 材 出 栈 ， 
| 
, | Time 
线程 模式 | ”Handler 模 式 | 线程 模式 
( 用 户 级 ) (特权 级 ) | (〈 用 户 级 ) 


图 3.9 “中断 前 后 的 状态 转换 十 特权 等 级 切换 





CONTROLL0] 只 有 在 特权 级 下 才能 访问 。 用户 级 的 程序 如 想 进 入 特权 级 , 通常 都 是 使 用 一 条 “ 系 
统 服务 呼叫 指令 (SVCD) ”来 触发 “SVC 异 各 风 该 寞 澡 的 服务 例 程 可 以 视 具体 情况 而 修改 CONTROL[0]。 


3.4 ” 异 帅 与 中 断 


Cortex-M3 支持 大 量 异 常 ， 包 括 16-4-1=11 个 系统 异常 ， 和 最 多 240 个 外 部 中 断 一 一 简称 IRQ。 
具体 使 用 了 这 240 个 中 断 源 中 的 多 少 个 , 则 由 芯片 制造 商 决 定 。 由 外 设 产 生 的 中 断 信 和 号, 除了 SysTick 
的 之 外 ， 全 都 连接 到 NVIC 的 中 断 输 入 信号 线 。 典 型 情况 下 ， 处 理 占 一 般 文 持 16 到 32 个 中 断 ， 当 
然 也 有 在 此 之 外 的 。 
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作为 中 断 功 能 的 强化 ，NVIC 还 有 一 条 NMI 输入 信号 线 。NMI 究竟 被 拿 去 做 什么 ， 还 要 视 处 理 
器 的 设计 而 定 。 在 多 数 情况 下 ，NMI 会 被 连接 到 一 个 看 门 狗 定 时 器 ， 有 时 也 会 是 电压 监视 功能 块 ， 
以 便 在 电压 掉 至 危险 级 别 后 警告 处 理 器 。NMI 可 以 在 任何 时 间 被 激活 ， 甚 至 是 在 处 理 器 刚刚 复位 之 
后 。 

表 3.4 列 出 了 Cortex-M3 可 以 支持 的 所 有 异常 。 有 一 定数 量 的 系统 异常 是 用 于 fault 处 理 的 ， 它 
们 可 以 由 多 种 错误 条 件 引 发 。NVIC 还 提供 了 一 些 fault 状态 寄存 器 ， 以 便于 fault 服务 例 程 找 出 导致 
异常 的 具体 原因 。 

表 3.4 ”Cortex-M3 中 的 异常 类 型 


3 硬 (hard) fault | -1 所 有 被 除 能 的 fault， 都 将 “上 访 ” 成 硬 fault。 除 能 的 原因 包括 
当前 被 茶 用 ， 或 者 被 PRIMASK 或 BASPRI 掩蔽 。 

5 总 线 fault 可 编程 从 总 续 系 统 收 到 了 错误 响应 ， 原 因 可 以 是 预 取 流产 ( Abort ) 或 
数据 流产 ， 或 者 企图 访问 协 处 理 器 


可 编程 。 | 调试 监视 器 ( 断 点 ， 数 据 观察 点 ， 或 者 是 外 部 调试 请 求 
为 系统 设备 而 设 的 “可 悬挂 请 求 " ( pendable request ) 
hh0 


Es 
| 

















第 7-9 章 给 出 了 寞 妾 操作 的 评 细 信息 。 


3.5 ” 问 量 表 


当 CM3 内 核 响应 了 一 个 发 生 的 异常 后 , 对 应 的 异常 服务 例 程 (ESR) 束 会 执行 。 为 了 决定 ESR 的 入 
口 地 址 ，CM3 使 用 了 “向 量 表 查 表 机 制 ”。 这 里 使 用 一 张 同 量 表 。 问 量 表 其 实 是 一 个 WORD (32 位 
整数 ) 数组， 每 个 下 标 对 应 一 种 异常 ， 该 下 标 元 素 的 值 则 是 该 ESR 的 入 口 地 址 。 癌 量 表 在 地 址 空间 
中 的 位 置 是 可 以 设置 的 ， 通 过 NVIC 中 的 一 个 重 定 位 寄存 器 来 指出 回 量 表 的 地 址 。 在 复位 后 ， 该 寄 
存 器 的 值 为 0。 因 此 ， 在 地 址 0 处 必须 包含 一 张 向 量 表 ， 用 于 初始 时 的 异常 分 配 。 

表 3.5 问 量 表 结 构 


异常 类 型 | 表 项 地 址 | 异常 问 量 
偏 移 量 
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1 or 
aa ooc aa 


1 oso | 训 攻 Ki 器 
14 m8 pnsv 
1 oo at 
18255 | 0x480xaFF |IRQf2 -39 


举 个 例子 ， 如 果 发 生 了 异常 11 (SVC), 则 ”NVIC 会 计算 出 偏 移 移 量 是 11x4=0x2C， 然 后 从 那里 
取出 服务 例 程 的 入 口 地 址 并 跳 入 。 要 注意 的 是 这 里 有 个 另类 : 0 号 类 型 并 不 是 什么 入 口 地 址 ， 而 是 
给 出 了 复位 后 MSP 的 初 值 。 





3.6 ”村 内 体操 作 


在 Cortex-M3 中 ， 除 了 可 以 使 用 PUSH 和 POP 指令 来 处 理 扒 栈 外 ， 内 核 还 会 在 异常 处 理 的 始末 
目 动 地 执行 PUSH 与 POP 操作 。 本 市 让 我 们 来 检视 一 下 具体 的 动作 ， 第 9 章 则 讨论 异 篆 处 理 时 的 目 
动 栈 操作 。 


3.6.1 扒 栈 的 基本 操作 


党 统 地 讲 , 堆栈 操作 就 是 对 内 存 的 读 写 操作 , 但 是 访问 地 址 由 SP 给 出 ,寄存 器 的 数据 通过 PUSH 
操作 存 入 堆栈 ， 以 后 用 POP 操作 从 堆栈 中 取 回 。 在 PUSH 与 POP 的 操作 中 ，SP 的 值 会 按 堆 栈 的 使 用 
法 则 自动 调整 ， 以 保证 后 续 的 PUSH 不 会 破坏 先前 PUSH 进去 的 内 容 。 

堆栈 的 功能 瓯 是 把 寄存 器 的 数据 临时 备份 在 内 存 中 ， 以 便 将 来 能 恢复 之 一 一 在 一 个 任务 或 一 段 
子 程序 执行 完毕 后 恢复 。 正 常情 况 下 ，PUSH 与 POP 必须 成 对 使 用 ， 而 且 参 与 的 寄存 器 ， 不 论 是 身 
份 还 是 先后 顺序 都 必须 完全 一 致 。 当 PUSH/POP 指令 执行 时 ，SpP 指针 的 值 也 根 着 自 减 / 自 增 。 

…〔 主 程序 ) 

; RO=X, R1=Y, R2=2 





BL FXxl1 


PUSH {RO } ;把 RO 存 入 栈 & 调整 SP 
PUSH {R1} ;把 Rl 存 入 栈 & 调整 SP 
PUSH 人 ;把 R2 存 入 栈 & 调整 SP 
;执行 Fx1 的 功能 ， 中 途 可 以 改变 R0-R2 的 值 
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BOP { R21} ; 恢复 R2 早先 的 值 & 再 次 调整 SP 
BOR {R1} ;恢复 R1 早先 的 值 & 再 次 调整 SP 
POP {RO} ; 恢复 RO 早先 的 值 & 再 次 调整 SP 
BX ER ; 返回 


I 


; 回 到 主 程序 





;RO=X，R1=Y，R2=2 《调用 Fx1 的 前 后 R0-R2 的 值 完 好 无 损 ， 从 寄存 右上 下 文 来 看 ， 残 好像 什么 部 没 肥 


生 过 一 样 ) 
3.10 ”基本 的 堆栈 操作 : 每 次 处 理 单个 寄 仓 器 


堆栈 操作 的 进一步 探讨 
如 果 参 与 的 寄存 器 比较 多 ， 这 种 PUSH 和 POP 岂 不 是 又 自 又 长 ?放心 ，PUSH/POP 指令 
足够 体贴 ， 文 持 一 次 操作 多 个 寄存 器 。 像 这 样 : 


BUSH TRO R21 ; 压 入 RO-R2 





PUSH {R3-R5,R8，R12} ; 压 入 R3-R5,R8， 以 及 R12 

在 POP 时 ， 可 以 如 下 操作 : 

POP {R3-R5, R8，R12) ;弹出 R3-R5，R8， 以 及 R12 

POP {RO-R2} ;弹出 RO0-R2 

注意 : 在 寄存 器 列表 中 ， 不 管 寄 存 器 的 序号 是 以 什么 顺序 给 出 的 ， 汇 编 右 都 将 把 它们 升 
序 排序 。 然 后 先 push 序号 大 的 寄存 器 ， 所 以 也 就 先 pop 序号 小 的 寄存 器 。( 这 是 详 者 在 实验 
中 发 现 的 )。 如 果 不 按 升 序 写 寄存 器 ， 也 许 有 些 汇 编 器 会 给 出 语法 错误 。 

PUSH/POP 对 子 还 有 这 样 一 种 特殊 形式 ， 形 如 


PUSH (RO R37 LR} 














POP {RO-R3, PC)} 

请 注意 : POP 的 最 后 一 个 寄存 器 是 PC， 并 不 是 先前 PUSH 的 LR。 这 其 实 是 一 个 返回 的 小 
技巧 。 与 其 按部就班 地 把 先前 LR 的 值 弹 回 LR， 再 复制 给 PC 来 返回 ; 不 如 干脆 绕 过 LR， 直 接 
传 给 PC! 那 不 怕 LR 的 值 没有 被 恢复 吗 ? 不 怕 ， 因 为 LR 在 子 程序 调用 中 的 唯一 用 处 ， 就 是 在 
返回 时 提供 返回 地 址 。 因 此 ， 在 返回 后 ， 先 前 保存 的 返回 地 址 束 没 有 利用 价值 了 ， 所 以 只 要 
PC 得 到 了 正确 的 值 ， 不 恢复 也 没关系 。 

PUSH 指令 等 效 于 与 使 用 R13 作为 地 址 指针 的 STMDB 指令 ， 而 POP 指令 则 等 效 于 使 用 
R13 作为 地 址 指针 的 LDMIA 指令 一 一 STMDB/LDMIA 还 可 以 使 用 其 它 寄存 器 作为 地 址 指针 。 至 
于 这 两 个 指令 的 细节 ， 第 4 章 讲 到 指令 系统 时 再 介绍 。 





3.7 Cortex-M3 的 堆栈 实现 


Cortex-M3 使 用 的 是 “加 下 生长 的 满 栈 ” 模型。 堆栈 指针 SP 指 问 最 后 一 个 被 压 入 堆栈 的 32 位 数值 。 


在 下 一 次 压 栈 时 ，SpP 先 目 减 4， 再 存 入 独 的 数值 。 
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RO | Ox12345678 


PUSH {RO} 





3.13 ”Cortex-M3 堆栈 的 PUSH 实现 方式 


POP 操作 刚好 相反 : 先 从 SP 指针 处 读 出 上 一 次 被 压 入 的 值 ， 再 把 SP 指针 目 增 4。 


地 直 
sp 
一 








RO| 一 | RO | 0x12345678 
图 3.14 Cortex-M3 堆栈 的 POP 实现 方式 


译注 : 虽然 POP 后 被 压 入 的 数值 还 保存 在 栈 中 ， 但 它 已 经 无 效 了 ， 因 为 为 下 次 的 PUSH 将 覆盖 它 的 值 ! 
在 进入 ESR 时 ，CM3 会 目 动 把 一 些 寄存 占 压 栈 ， 这 里 使 用 的 是 发 生 本 异常 的 瞬间 正在 使 用 的 SP 
和 针 《MSP 或 者 是 PSP)。 离 开 ESR 后 ， 只 要 ESR 没有 更 改过 CONTROL[1]， 就 依然 使 用 发 生 本 次 异 
常 的 瞬间 正在 使 用 的 SP 指针 来 执行 出 栈 操作 。 


3.7.1 再 论 Cortex-M3 的 双 堆 栈 机 制 


我 们 已 经 知道 了 CM3 的 堆栈 是 分 为 两 个 : 主 堆 栈 和 进程 堆栈 ，CONTROL[1] 决 定 如 何 选 择 。 
当 CONTROL[1]=0 时 ， 只 使 用 MSP， 此 时 用 户 程 序 和 异常 handler 共享 同一 个 堆栈 。 这 也 是 复位 
后 的 缺 省 使 用 方式 。 




















中 断 退出 
中 汤 服务 例 程 (SR 








主 程 序 入 栈 出 栈 
~ L IlL 
| 0 
线程 模式 | Handler 模 式 | 线程 模式 时 间 
(使 用 MSP) ) (使 用 MSP) | (使 用 MsP) 


3.15 CONTROL[1]=0 时 的 堆栈 使 用 情况 


当 CONTROL[1]=1 时 ， 线 程 模式 将 不 再 使 用 MSP， 而 改 用 PSP (handler 模式 永远 使 用 MSP)。 这 
样 做 的 好 处 在 哪里 ?原来 ， 在 使 用 0S 的 环境 下 ， 只 要 0S 内 核 仅 在 handler 模式 下 执行 ， 用 户 应 用 
程序 仪 在 用 户 模式 下 执行 ， 这 种 双 堆 栈 机 制 派 上 了 用 场 一 一 防止 用 户 程 序 的 堆栈 错误 破坏 OS 使 用 
的 堆栈 。 
译注 : 此 时 ， 进 入 寞 当时 的 目 动 压 栈 使 用 的 是 进程 堆栈 ， 进 入 寞 党 handler 后 才 目 动 改 为 MSP， 退 出 寞 常 时 切换 回 
PSP， 并 且 从 进程 堆栈 上 弹出 数据 。 
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| 
| 
| 
中 断 事 件 | 
| 
个 
主 程序 入 栈 出 栈 
| 
| | | 
线程 模式 | Handler 模 式 线程 模式 时 间 
(PSP) | 合用 MSP) | (使 用 PsP) 


3.16 CONTROL[1]=1 时 的 堆栈 切换 情况 
在 特权 级 下 ， 可 以 指定 具体 的 堆栈 指针 ， 而 不 受 当前 使 用 堆栈 的 限制 ， 示 例 代 码 如 下 : 








MRS RO MSP ; 读 取 主 堆栈 指针 到 RO 
MSR MSP, RO0 ; 写 RO 的 值 到 主 堆栈 中 
MRS RO, PSP ; 读 取 进程 堆栈 指针 到 RO 


MSR PSP, RO0 ; 写 R0 的 值 到 进程 堆栈 中 
通过 读 取 PSP 的 值 , OS 就 能 够 获取 用 户 应 用 程序 使 用 的 堆栈 , 进一步 地 就 知道 了 在 发 生 寞 单 时 ， 
外 Q 压 入 寄存 右 的 内 容 ， 而 且 还 可 以 把 其 它 寄 存 右 进 一 步 压 栈 (使 用 STMDB 和 LDMIA 的 书写 形式 )。 
OS 还 可 以 修改 PSP， 用 于 实现 多 任务 中 的 任务 上 下 文 切 换 。 


3.8 ”复位 序列 


在 离开 复位 状态 后 ，CM3 做 的 第 一 件 事 就 是 读 取 下 列 两 个 32 位 整数 的 值 : 

@ ”从 地 址 0x0000,0000 处 取出 MSP 的 初始 值 。 

@ 从 地 址 0x0000,0004 处 取出 PC 的 初始 值 一 一 这 个 值 是 复位 问 量 ，LSB 必须 是 1。 然 后 从 这 
个 值 所 对 应 的 地 址 处 取 指 。 




















取出 初始 取出 从 复位 向 量 
的 MSP 值 复位 向 量 ee 处 取 指 

Address = Address = dress = 
0x00000000 | Ox00000004 et Vector 





3.17 ”复位 序列 


其 实 也 和 绝 大 多 数 的 其 它 单 厂 机 不 同 。 传 统 的 ARM 淋 





请 注意 ， 这 与 传统 的 ARM 架构 不 同 
构 总 是 从 0 地 址 开始 执行 第 一 条 指令 。 它们 的 0 地址 处 总 是 一 条 跳 转 指令 。 在 CM3 中 ， 在 0 地 址 处 





提供 MSP 的 初始 值 ， 然 后 紧 跟 着 就 是 阿 量 表 《〈“ 辣 量 表 在 以 后 还 可 以 被 移 至 其 它 位 置 一 一 译 浅 。 向 
量 表 中 的 数值 是 32 位 的 地 址 ， 而 不 是 跳 转 指令 。 向 量 表 的 第 一 个 条 目 指向 复位 后 应 执行 的 第 一 条 


指令 。 
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本 MSP 的 初始 值 
0x20008000 





0x20008000 
0x20007FFC | 第 一 个 入 栈 的 元 率 
0x20007FF8 | 第 二 个 入 栈 的 元 泰 








| 


Ox20007C00 | | 





Ox00000004 


Ox00000000 
3.18 ”初始 MSP 及 PC 初始 化 的 一 个 范例 


因为 CM3 使 用 的 是 向 下 生长 的 满 栈 , 所 以 MSP 的 初始 值 必须 是 堆栈 内 存 的 末 地 址 加 1。 六 列 来 
说 ， 如 果 你 的 堆栈 区 域 在 0x20007C00-0x20007FFF 之 间 ， 那 么 MSP 的 初始 值 就 必须 是 0x20008000。 

向 量 表 跟 随 在 MSP 的 初始 值 之 后 一 一 也 就 是 第 2 个 表 目 。 要 注意 因为 CM3 是 在 Thumb 态 下 执 
行 ， 所 以 向 量 表 中 的 每 个 数值 都 必须 把 LSB 置 1 (也 就 是 奇数 )。 正 是 因为 这 个 原因 ， 图 3.18 中 使 用 
0x101 来 表达 地 址 0x100。 当 0x100 处 的 指令 得 到 执行 后 ， 束 正式 开始 了 程序 的 执行 。 在 此 之 前 初始 
化 MSP 是 必需 的 ， 因 为 可 能 第 1 条 指令 还 没 来 得 及 执行 ， 束 发 生 了 NMI 或 是 其 它 fault。MSP 初始 
化 好 后 就 已 经 为 它们 的 服务 例 程 准备 好 了 堆栈 。 

对 于 不 同 的 开发 工具 , 需要 使 用 不 同 的 格式 来 设置 MSP 初 值 和 复位 癌 量 一 一 有 些 则 由 开发 工具 
自行 计算 并 生成 。 如 果 想 要 获知 细节 ， 最 快 的 办 法 就 是 参考 开发 工具 提供 的 一 个 示例 工程 。 本 书 的 
第 10 章 和 第 20 章 介 绍 ARM 提供 的 开 友 工具 ， 第 19 章 则 介绍 GCC 工具 链 。 
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己 作 
指令 集 
e@ 汇编 语言 基础 
e@ ”指令 集 
e@ 。 近 距离 地 检视 指令 
e@ cortex-M3 中 的 一 些 新 好 指令 





终于 “ 开 芝 ”了 ， 本 半 开 始 把 Cortex-M3 的 指令 系统 展现 出 来 ,并且 给 出 了 一 些 简单 却 意味 深 
长 的 例子 。 在 本 书 的 附录 A 中 还 有 一 个 快速 查阅 参 考 。 指 令 集 的 详细 信息 由 《ARMv7-M 
Architecture Application Level Reference Manual》(Ref2) 给 出 一 一 写 了 两 百 多 页 呢 。 

如 末 读 者 以 前 没有 写 过 ARM 汇编 程序 ， 可 以 结合 看 本 书 的 第 26 章 ， 那 里 讲述 了 Keil RVMDK 工具 的 使 用 ， 包 
括 添加 汇编 源 文件 的 方法 。RVMDK 带 了 一 个 指令 模拟 器 ， 对 于 练习 汇编 程序 非常 有 帮助 。 那 一 章 虽 然 不 是 很 短 但 很 
简单 。 值 得 一 提 的 是 ， 在 那 一 章 的 末尾 ， 译 者 添加 了 少量 内 容 ， 是 专 为 学 习 第 4 章 而 添加 的 。 


4.1 汇编 语言 基础 


为 了 给 本 章 的 学 习 扫 清 障 碍 ， 这 里 我 们 先 简 要 地 介绍 一 下 ARM 汇编 器 的 基本 语法 。 本 书 绝 大 多 
数 的 汇编 示例 都 使 用 ARM 汇编 器 的 语法 ， 而 第 19 章 则 使 用 GCC 汇编 器 As 的 语法 。 


4.1.1 ”汇编 语言 ， 基 本 语法 
汇编 指令 的 最 典型 书写 模式 如 下 所 示 : 


一 上 


标号 
操作 码 操作 数 1， ”操作 数 2， … ;注释 


















































其 中 , 标号 是 可 选 的 , 如 果 有 ， 它 必须 顶 格 写 。 标 写 的 作用 是 让 汇编 带 来 计算 程序 转移 的 地 址 。 

操作 人 码 是 指令 的 助 记 符 ， 它 的 前 面 必 须 有 至 少 一 个 空白 符 ， 通 利 使 用 一 全 二 个 “Tab” 键 来 产 
生 。 操 作 人 码 后 面 往往 跟随 大 干 个 操作 数 ， 而 第 1 个 操作 数 ， 通 着 都 给 出 本 指令 的 执行 结束 存储 处 。 
不 同 指令 需要 不 同 数 目的 操作 数 ， 并 且 对 操作 数 的 语法 要 求 也 可 以 不 同 。 莅 例 来 说 ， 立 即 数 必须 以 
“#” 开 关 ， 如 

















MOV RO, Ow : RO < 0x12 
MOV R1, #7 五 / ; R1 革 字母 A 的 ASCII 公 








注释 均 以 ”2 开头， 它 的 有 无 不 影 啊 汇 编 郝 工作 ， 只 是 给 程序 员 看 的 ， 能 让 程序 更 易 理 解 。 
还 可 以 使 用 EQU 指示 孚 来 定义 种 数 ， 然 后 在 代码 中 使 用 它们 ， 例 如 








NVIC IRO SETENO EQU 0xE000E100 ; 注意 : 负数 定义 必须 顶 格 写 
NVIC_IROO_ENRABIE EOU Ox1 
LDR RO, =NVIC_ IRO SETENO ; 在 这 里 的 LDR 是 个 伪 指 令 ， 它 会 被 汇编 器 转换 成 
; 一 条 \ 相 对 PC 的 加 载 指令 
MOV R1, #NVIC IROO_ ENABLE ; 把 立即 数 传 送 到 RL 中 
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STR Ris [RO ; *R0=R1， 执 行 完 此 指令 后 IRQ #0 被 使 能 。 

如 果 汇 编 占 不 能 识别 某 些 特殊 指令 的 助 记 得 ， 你 束 要 “手工 汇编 ”一 一 伟 出 该 指令 的 确切 二 进 
制 机 器 码 ， 然 后 使 用 DCI 编译 器 指示 字 。 例 如 ，BKPT 指令 的 机 器 个 是 @xBE68， 即 可 以 按 如 下 格式 
二 

DCI 0xBE00 ; 断 点 (BKPT) ， 这 是 一 个 16 位 指令 

(在 使 用 DCI 时 也 必须 在 前 面 留 出 空白 符 一 一 译注 ) 

类 似 地 ， 你 还 可 以 使 用 DCB 来 定义 一 串 凶 市 第 数 ， 字 市 弟 数 还 允许 以 字符 串 的 形式 来 表达 ; 还 
可 以 使 用 DCD 来 定义 一 串 32 位 整数 。 它 们 最 党 被 用 来 在 代码 中 书写 表格 。 例 如 : 





TD R3, =MY_ NUMBER ; R3= MY_NUMBER 

LDR R4, [R3] ; RR4= *R3 

六 及 RO, =HELLO_ TEXT ; RO0O= HELLO TEXT 

BL PrintText ; ”呼叫 PrintText 以 显示 字符 串 ，R0 传递 参数 
MY_NUMBER 

DCD 0x12345678 


HELLO TEXT 
DCB "Hello\n”,0 








请 注意 : 不 同 汇 编 融 的 指示 字 和 语法 部 可 以 不 同 。 上述 示 例 代码 都 是 按 ARM 沪 编 占 的 语法 格式 
写 的 。 如 果 使 用 其 它 汇 编 融 ， 最 好 看 一 看 它 附 市 的 示例 代 但 。 














4.1.2 ”汇编 语言 : 后 级 的 使 用 


在 ARM 处 理 嚣 中， 指令 可 以 市 有 后 级 ， 如 表 4.1 所 示 。 


要 求 更 新 APSR 中 的 相关 标志 ， 例 如 : 
ADDS  R0， R1 ”; 根据 加 法 的 结束 更 新 APSR 中 的 标志 





EQ,NE,LT,GT 等 ”| 有 条 件 地 执行 指令 。EQ=Euqal, NE= Not Equal, LT= Less Than, GT= Greater Than， 

例如 : 

BEQ <Label> ”; 仪 当 EQ 满足 时 转移 

除了 这 4 种， 还 有 若干 个 其 它 的 条 件 。 

在 Cortex-M3 中 ， 对 条 件 后 级 的 使 用 有 很 大 的 限制 : 只 有 转移 指令 (B 指令 ) 才 可 随意 使 用 。 

而 对 于 其 它 指令 , CM3 引入 了 IF-THEN 指令 块 , 在 这 个 块 中 才 可 以 加 后 级 , 且 必 须 加 以 后 级 。IF-THEN 
块 由 IT 指令 定义 ， 本 章 稍 后 将 介绍 它 。 另 外 ，s 后 级 可 以 和 条 件 后 级 在 一 起 使 用 。 共 有 15 种 不 同 的 
条 件 后 级 ， 稍 后 介绍 。 


4.1.3 ”汇编 语言 统一 汇编 语言 书写 语法 


为 了 最 有 力 地 文 持 Thumb-2， 也 作为 对 汇编 程序 员 的 人 文 关怀 ，ARM 汇编 右 引 了 一 个 “统一 汇 
编 语 于 (UAL) ”语法 机 制 , 对 于 16 位 指令 和 32 位 指令 均 能 实现 的 一 坚 操 作 ( 利 匈 于 数据 处 理 操作 )， 
有 时 虽然 指令 的 实际 操作 数 不 同 ， 或 者 对 立即 数 的 长 度 有 不 同 的 限制 ， 但 是 汇编 右 允 许 开发 者 统一 
使 用 32 位 Thumb-2 指令 的 语法 格式 书写 (很 多 Thumb-2 指令 的 用 法 也 与 32 位 ARM 指令 相同 )， 并 
且 由 汇编 器 来 决定 是 使 用 16 位 指令 ， 还 是 使 用 32 位 指令 。 以 前 ，Thumb 的 语法 和 ARM 的 语法 不 
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同 ， 在 有 了 UAL 之 后 ， 两 者 的 书写 格式 残 统一 了 。 

ADD RO, R1 ; 使 用 传统 的 Thumb 语法 

ADD RO, RO, R1 ; 引入 UAL 后 允许 的 等 效 写法 (R0=R0+R1) 

虽然 引入 了 UAL, 但 是 仍然 允许 使 用 传统 的 Thumb 语法 。 不 过 有 一 项 必须 注意 : 如 果 使 用 传统 
的 Thumb 语法 ， 有 些 指令 会 默认 地 更 新 APSR， 即 使 你 没有 加 上 后 级 。 如 果 使 用 UAL 语法 ， 则 必 
须 指 定 $ 后 级 才 会 更 狐 。 例 如 : 

AND RO, R1 ; 传统 的 Thump 语法 

ANDS RO, RO, R1 ;等 值 的 UAL 语法 (必须 有 s 后 级 ) 

在 Thumb-2 指令 集中 ， 有 些 操作 既 可 以 由 16 位 指令 完成 ， 也 可 以 由 32 位 指令 完成 。 例 如 ， 
RO=RO+1 这 样 的 操作 ，16 位 的 与 32 位 的 指令 都 提供 了 助 记 符 为 “ADD” 的 指令 。 在 UAL 下， 汇编 
避 能 主动 决定 用 哪个 ， 也 可 以 手工 指定 是 用 16 位 的 还 是 32 位 的 : 














ADDS RO, #1 ; 汇编 器 将 为 了 节省 空间 而 使 用 16 位 指令 
ADDS.N RO0, #1 ; 指定 使 用 16 位 指令 (N= 二 Narrow) 
ADDS.W RO, #1 ; 指定 使 用 32 位 指令 (WwW=wWide) 





.W(Wide) 后 级 指定 32 位 指令 。 如 果 没 有 给 出 后 级 , 汇编 器 会 先 试 着 用 16 位 指令 以 给 代码 瘦身 ， 
如 果 不 行 再 使 用 32 位 指令 。 因 此 ， 使 用 “.N” 其 实 是 多 此 一 人 蕉 ,不 过 汇编 右 可 能 仍然 允许 这 样 的 语 
人 

再 次 重申 ， 这 是 ARM 公司 汇编 亏 的 语法 ， 其 它 汇编 右 的 可 能 略 有 区 列 ， 但 如 末 没 有 给 出 后 绥 ， 
汇编 右 吏 总 是 会 尽量 选择 更 短 的 指令 。 

其 实在 绝 大 多 数 情 况 下 ， 应 用 程序 是 用 C 与 的 ，C 编 详 旧 也 会 尽 可 能 地 使 用 短 指令 。 然 而 ， 当 
立即 数 超出 一 定 疙 围 时 ， 或 者 32 位 指令 能 更 好 地 适合 茶 个 操作 ， 将 使 用 32 位 指令 。 

32 位 Thumb-2 指令 也 可 以 按 半 字 对 齐 〈 以 前 ARM 32 位 指令 都 必须 按 字 对 齐 一 一 译注 )， 因 此 




















下 例 是 允许 的 : 
Ox1000: LDR Oe [Rl] ;一 个 16 位 的 指令 
UR ;一 个 32 位 的 指令 ， 以 0x1002 为 起 始 地址 ， 跨 越 了 字 的 边界 


绝 大 多 数 16 位 指令 只 能 访问 RO-R7;32 位 Thumb-2 指令 则 可 以 随意 访问 RO-R15。 人 时 ,把 R15(PC) 
作为 目的 寄存 器 很 容易 走火 入 麻 一 一 用 对 了 会 有 意 想不到 的 妙 处 ， 出 错时 则 会 使 程序 跑 飞 。 通 常 只 
有 系统 软件 才 会 不 惜 冒险 地 做 此 高 危 行为 ， 因 此 还 需 慎 用 。 对 PC 的 使 用 还 有 其 它 的 戒律 ， 如 果 感 
兴趣 ， 可 以 参考 《ARMv7-M 架构 应 用 级 参考 手册 》。 


4.2 ”指令 集 
Cortex-M3 支持 的 指令 在 表 4.2 至 表 4.9 列 出 。 其 中 ， 译 者 添加 了 如 下 格式 


边框 加 粗 的 是 从 ARMv6T2 才 支 持 的 指令 。 
双 线 边框 的 是 从 Cortex-M3 才 文 持 的 指令 “〈vz7 的 其 它 球 式 不 一 定 支 持 ) 
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详 者 添加 
在 讲 指令 之 前 ， 先 简单 地 介绍 一 下 Cortex-M3 中 支持 的 算术 与 逻辑 标志 。 本 书 
在 后 面 还 会 展开 论述 。 它 们 是 : 
APSR 中 的 5 个 标志 位 
N: 负数 标志 (Negative) 











零 结 果 标 志 (Zero) 
进位 / 借 位 标志 (Carry) 
溢出 标志 (overflow) 


饱和 标志 (Saturation)， 它 不 做 条 件 转 移 的 依据 
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4.2.1 ”分 类 指令 表 


表 4.2 16 位 数据 操作 指令 





按 位 请 0〈 把 一 个 数 跟 为 一 个 无 符 写 数 的 反 但 控 位 与 ) 





圆 净 右 移 
市 价位 的 减法 














sxTB | 带 符号 扩展 一 个 字 节 到 32 位 
sxTH | 带 符 号 扩展 一 个 半 字 到 32 位 
XTB | 无 符号 扩展 一 个 字 忆 到 32 人 人 


符号 扩展 一 个 半 字 到 32 位 


了 


在 
人 


EE: 
全 





并 
人 








Sl 
: 


表 4.3 16 位 转移 指令 


BB Xf 办 
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sm 


表 4.4 16 位 存储 器 数据 传送 指令 


字 
从 存储 器 中 加 载 字 到 一 个 寄存 器 中 
从 存储 器 中 加 载 半 字 到 一 个 寄存 器 中 
从 存储 器 中 加 载 字 节 到 一 个 寄存 器 中 
从 存储 器 中 加 载 半 字 ， 再 经 过 带 符号 扩展 后 存储 一 个 寄存 器 让 
从 存储 器 中 加 哉 字 节 ， 再 经 过 带 符号 扩展 后 存储 一 个 寄存 器 中 


STR | 把 一 个 寄存 器 按 字 存 储 到 存储 器 中 
STRH | 把 一 个 寄存 器 存 器 的 低 半 字 存储 到 存储 器 中 














把 一 个 寄存 器 的 低 字 节 存储 到 存储 器 中 
LDMIA | 加 载 多 个 字 ， 并 且 在 加 载 后 目 增 基 址 寄存 咒 
存储 多 个 字 ， 并 且 在 存储 后 自 增 基 址 寄存 器 
压 入 多 个 寄存 器 到 栈 中 

POP “| 从 栈 中 弹出 多 个 值 到 寄存 器 中 




















16 数据 传送 指令 没有 任何 新 内 容 ， 因 为 它们 是 Thumb 指令 ， 在 v4T 时 就 已 经 定格 了 一 一 详 注 





表 4.5 其 它 16 位 指令 


系统 服务 调用 
靳 点 指令 。 如 宁 使 能 了 调试 ， 则 进入 调试 状态 〈 俘 机 )。 人 否则 的 话 产生 调试 监视 项 掉 
常 。 在 调试 监视 占 异 常 被 使 能 时 , 调用 其 服务 例 程 ; 如 果 连 调试 监视 右 寞 汕 也 被 除 能 ， 
则 无 妹 下 只 好 诉 诸 于 一 个 fault 弄 第 

op AK 扣 f 

使 能 PRIMASK(CPSIE i)/ FAULTMASK(CPSIE 一 一 清 0 相应 的 位 

除 能 PRIMASK(CPSID i)/ FAULTMASK(CPSID 人 一 一 置 位 相应 的 位 

















表 4.6 32 位 数据 操作 指令 


功能 
带 进位 加 法 





BPT | 位 段 插入 
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人 负 癌 比较 (把 一 个 数 和 为 一 个 数 的 三 进 制 补 公 比较， 并 更 新 标志 位 》 





比较 两 个 数 并 更 新 标志 位 

MoVW | 把 16 位 立即 数 放 到 寄存 器 的 低 16 位 ， 高 16 位 清 0 

加 载 16 位 立即 数 到 寄存 器 〈 其 实 汇编 器 会 产生 MOVW 一 一 译注 ) 

把 16 位 立即 数 放 到 寄存 器 的 高 16 位 ， 低 16 位 不 影响 

MN | 移动 -个 数 的 和 
按 位 或 原文 为 逻辑 或 ， 有 误 一 一 译注 ) 

ORN “| 把 源 操作 数 按 位 取 反 后 ， 再 执行 按 位 或 (原文 为 逻辑 或 ， 有 误 一 一 译注 ) 

E 位 反 转 (把 一 个 32 位 整数 用 2 进 制 表达 后 ， 再 旋转 180 度 一 一 译注 ) 

对 一 个 32 位 整数 按 字 节 反 转 

| 一 个 32 位 整数 的 高 低 半 字 都 执行 字 节 反 转 

















这 








VSH | 对 一 个 32 位 整数 的 低 半 字 执 行 季节 反 园 ， 再 市 待 号 扩展 成 32 位 数 





圆 净 右 移 
市 进位 位 的 逻辑 右 移 一 格 〈 最 高 位 用 CC 填充， 执行 后 不 影响 C 的 值 一 一 详 注 ) 
从 一 个 32 位 整数 中 提取 任意 长 度 和 位 置 的 位 段 ， 并 且 市 符号 扩展 成 32 位 整数 











区 自 | 目 自 











个 32 位 整数 相 乘 得 到 64 位 的 带 符号 积 


G 


5 
tH 


宽 减 法 ， 可 以 减 12 位 立即 数 

字 节 市 符号 扩展 到 32 位 数 

测试 是 否 相 每 (对 两 个 数 执行 异 或 ， 更 新 标志 但 不 存储 结果 ) 

测试 《对 两 个 数 执行 按 位 与 ， 更 狐 Z 标志 但 不 存储 结果 ) 

0 

ee 条 (两 个 无 符号 的 32 位 整数 相 乘 得 到 64 位 的 无 符号 积 ， 再 把 积 加 到 另 一 
个 无 符号 64 位 整数 中 ) 

无 符号 长 乘法 (两 个 无 符号 的 32 位 整数 相 乘 得 到 64 位 的 无 符号 积 ) 























< 

















2 饱和 操作 (但 是 源 操作 数 是 市 符号 的 一 一 详 注 ) 
无 符号 扩展 到 32 位 (高 24 位 清 0 一 一 译注 ) 








| 
Ek 
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_UXTH | 半 字 被 无 符号 扩展 到 32 位 (高 16 位 清 0 一 一 译注 ) 


表 4.7 32 位 存储 器 数据 传送 指令 


加 载 字 到 寄存 器 
LD 加 载 字 节 到 寄存 器 
LDRH | 加 载 半 字 到 寄存 器 
LDRSH | 加 载 半 字 到 寄存 器 ， 再 带 符号 扩展 到 32 位 
从 一 片 连续 的 地 址 空间 中 加 载 若干 个 字 ， 并 选中 相同 数目 的 寄存 器 放 进 去 
从 连续 的 地 址 空间 加 载 双 字 (64 位 整数 ) 到 2 个 寄存 器 
存储 寄存 器 中 的 子 
存储 寄存 器 中 的 低 字 节 
存储 寄存 器 中 的 低 半 字 
存储 若干 寄存 器 中 的 字 到 一 片 连续 的 地 址 空间 中 ， 占 用 相同 数目 的 字 
STRD | 存储 2 个 寄存 器 组 成 的 双 字 到 连续 的 地 址 空间 中 
把 若干 寄存 器 的 值 压 入 堆栈 中 


从 堆栈 中 弹出 硅 干 的 寄存 右 的 值 


表 4.8 32 位 转移 措 令 


名 字 
3 
以 字 节 为 单位 的 查 表 转 移 。 从 一 个 字 节 数组 中 选 一 个 8 位 前 向 跳 转 地 址 并 转移 

以 半 字 为 单位 的 查 表 转 移 。 从 一 个 半 字 数组 中 选 一 个 16 位 前 向 跳 转 的 地 址 并 转移 


















































表 4.9 其 它 32 位 指令 


加 载 字 到 寄存 器 ， 并 且 在 内 核 中 标明 一 段 地 址 进入 了 互 斥 访问 状态 

加 载 半 字 到 寄存 器 ， 并 且 在 内 核 中 标明 一 段 地 址 进入 了 互 斥 访问 状态 

加 载 字 节 到 寄存 器 ， 并 且 在 内 核 中 标明 一 段 地 址 进入 了 互 斥 访问 状态 

STREX | 检查 将 要 写 入 的 地 址 是 否 已 进入 了 互 斥 访问 状态 ， 如 果 是 则 存储 寄存 器 的 字 
STREXH | 检查 将 要 写 入 的 地 址 是 否 已 进入 了 互 斥 访问 状态 ， 如 果 是 则 存储 寄存 器 的 半 字 
STREXB | 检查 将 要 写 入 的 地 址 是 否 已 进入 了 互 斥 访问 状态 ， 如 果 是 则 存储 寄存 器 的 字 节 

在 本 地 处 理 器 上 清除 互 斥 访 问 状态 的 标记 《先前 由 LDREX/LDREXH/LDREXB 做 的 标记 ) 


























MRS | 加 载 特殊 功能 寄存 器 的 值 到 通用 寄存 器 
MSR ”| 存储 通用 寄存 器 的 值 到 特殊 功能 寄存 器 
OP | 人 作 
WE | 休 眼 并 且 在 发 生 事件 时 被 唤醒 
本 工 | 休 痕 并 且 在 发 生 中 断 时 被 唤醒 
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指令 同步 隔离 (与 流水 线 和 MPU 等 有 关 一 一 详 广 ) 
司 步 隔 离 “〈 与 流水 线 、MPU 和 cache 等 有 关 一 -一 译注 ) 





数据 存储 隔离 《与 流水 线 、MPU 和 cache 等 有 关 一 -一 译注 ) 


4.2.2 未 文 持 的 指令 


有 奋 干 条 Thumb 指令 没有 得 到 Cortex-M3 的 文 持 ， 下 表 列 出 了 未 被 文 持 的 指令 ， 以 及 不 文 持 的 
原因 。 


表 4.10 因为 不 再 是 传统 的 架构 ， 导 致 有 些 指 令 已 失去 意义 


未 支持 的 以 前 的 功能 
指令 
BEX—#im 在 使 用 立即 数 做 操作 数 时 ，BLX 总 是 要 切入 ARM 状态 。 因 为 Cortex-M3 只 在 Thumb 态 下 运 
行 ， 故 以 此 指令 为 代表 的 ， 凡 是 试图 切入 ARM 态 的 操作 ， 都 将 引发 一 个 用 法 fault。 
SEPENB 由 ARMv6 引入 的 ， 在 运行 时 改变 处 理 器 端 设 置 的 指令 (大 端 或 小 端 )。 因 为 Cortex-M3 不 
支持 动态 端的 功能 ， 所 以 此 指令 也 将 引发 fault 











CM3 也 不 文 持 有 少量 在 ARMv7-M 中 列 出 的 指令 。 比 如 ，ARMv7M 文 持 Thumb2 的 协 处 理 絮 指 
令 , 但 是 CM3 却 不 能 挂 协 处 理 器 。 表 4.11 列 出 了 这 些 与 协 处 理 器 相关 的 指令 。 如 果 试 图 执行 它们 ， 
则 将 引发 用 法 fault (NVIC 中 的 NOCP (No CoProcessor) 标志 置 位 )。 





表 4.11 不 支持 的 协 处 理 器 相关 指令 


未 支持 以 前 的 功能 

的 指令 

MSR 把 通用 寄存 器 的 值 传送 到 协 处 理 器 的 寄存 器 中 

MER2 把 通用 寄存 器 的 值 传送 到 协 处 理 器 的 寄存 器 中 

MERR 把 通用 寄存 器 的 值 传送 到 协 处 理 器 的 寄存 器 中 ， 一 次 操作 两 个 
MRE 把 协 处 理 器 寄存 器 的 值 传 送 到 通用 寄存 器 中 

MRE2 把 协 处 理 器 寄存 器 的 值 传送 到 通用 寄存 器 中 

MRRE 把 协 处 理 器 寄存 器 的 值 传送 到 通用 寄存 器 中 ， 一 次 操作 两 个 
EBE 把 茶 个 连续 地 址 空间 中 的 一 串 数 值 传送 至 协 处 理 器 中 

SEE 从 协 处 理 器 中 传送 一 串 数 值 到 地 址 连续 的 一 段 地 址 空间 中 


还 有 一 个 是 改变 处 理 器 状态 指令 (CPS)， 它 的 一 些 用 法 也 不 再 支持 。 这 是 因为 PSRs 的 定义 已 经 
变 了 ， 以 前 在 ARMv6 中 定义 的 某 些 位 在 CM3 中 并 不 存在 。 


表 4.12 不 支持 的 CPS 指令 用 法 


未 支持 的 指令 以 前 的 功能 
epPSs<FEAFEB>— HA CM3 没有 A” 位 
Dy 
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EPS.W-—#mede CM3 的 PSR 中 没有 “mode” 位 





有 些 提 示 (hint) 指令 的 功能 不 支持 ， 它 们 在 CM3 中 按 “NOP” 指 令 对 待 


表 4.13 不 支持 的 hint 指令 


未 支持 的 指令 以 前 的 功能 

BBE 服务 于 跟踪 系统 的 一 条 hint 指令 

PEB 预 取 数 据 。 这 是 服务 于 cache 系统 的 一 条 hint 指令 。 因 为 在 CM3 中 没有 cache， 
该 指令 就 相当 于 NOP 

PEE 预 取 指令 。 这 是 服务 于 cache 系统 的 一 条 hint 指令 。 因 为 在 CM3 中 没有 cache， 
该 指令 就 相当 于 NOP 

¥EEED 用 于 多 线程 处 理 。 线 程 使 用 该 指令 通知 给 硬件 : 我 正在 做 的 任务 可 以 被 交换 出 去 


(swapped out) ， 从 而 提高 系统 的 整体 性 能 。 


4.3 “ 近 距 离 检视 指令 


从 现在 起 , 我 们 将 介绍 一 些 在 ARM 汇编 代 人 码 中 很 通用 的 指令 及 其 语法 。 有 些 指令 可 以 带 有 多 种 
附加 处 理 ， 比 如 预 移 位 操作 。 本 章 不 会 讲 得 面 面 惧 到 ， 但 理解 本 章 后 足以 应 付 大 多 数 大 型 汇编 程序 
开 肥 。 








4.3.1 “汇编 语言 ， 数据 传送 


处 理 器 的 基本 功能 之 一 就 是 数据 传送 。CM3 中 的 数据 传送 类 型 包括 
@ 在 两 个 寄存 器 间 传 送 数据 

@ 在 寄存 器 与 存储 器 间 传 送 数 据 

@ 在 寄存 器 与 特殊 功能 寄存 器 间 传 送 数据 

@ 把 一 个 立即 数 加 载 到 寄存 器 


用 于 在 寄存 器 间 传送 数据 的 指令 是 MOV。 比 如 ， 如 果 要 把 R3 的 数据 传送 给 R8， 则 写作 : 

MOV Rg, R3 

MOV 的 一 个 衍生 物 是 MVN， 生 把 寄存 右 的 内 容 取 反 后 再 传达 。 

用 于 访问 存储 右 的 基础 指令 是 “加载 (Load)” 和 “存储 (Store)”。 谓 蕴 令 LDR 把 存储 器 中 
的 内 容 加 载 到 寄存 占 中 ， 和 存储 指令 STR 则 把 寄存 帮 的 内 容 存 储 全 存储 右 中 ， 传 送 过 程 中 数据 类 型 也 
可 以 变通 ， 最 第 使 用 的 格式 有 : 


表 4.14 常用 的 存储 器 芒 问 指令 


功能 描述 
从 地 址 Rntoffset 处 读 取 一 不 字 节 送 到 Ra 


LDRH Rd, [Rn, #offset] 从 地 址 Rn+offset 处 读 取 一 个 半 字 送 到 Rd 








pi Rntoffset 处 读 了 一 个 字 适 到 Re 


Rd1l，Rd2，[Rn， #offset] 从 地 址 Rn+offset 处 读 取 一 个 双 字 (64 位 整数 ) 送 到 Rd1 
( 低 32 位 ) 和 Rd2 (高 32 位 ) 中 。 
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STRD Rd1l，Rd2，[Rn， #offset] | 把 Rd1 ( 低 32 位 ， 和 Rd2 (高 32 位 ) 表达 的 双 字 存储 
到 地 址 Rn+offset 处 


如 果 嫌 一 口 一 口 地 天 食 太 不 过 并 ,也 可 以 使 用 LDM/STM 来 乌 存 。 它 们 相当 于 把 知 干 个 LDR/STR 
给 合并 起 来 了 ， 有 利于 减少 代码 量 ， 如 表 4.15 所 示 


表 4.15 单 用 的 多 重仓 储 器 访 占 方式 


示例 功能 描述 


STMIRA ”Rd!， { 寄 存 器 列表 } 依次 存储 寄存 器 列表 中 各 寄存 器 的 值 到 Rd 给 出 的 地 址 。 
每 存 一 个 字 后 Rd 目 增 一 次 ，16 位 宽度 


STRH Rd, [Rn, #offset] 把 Rd 中 的 低 半 字 存 储 到 地 址 Rn+offset 处 








STMDB.W Rd!， { 寄 存 器 列表 ) 存储 多 个 字 到 Rd 处 。 每 存 一 个 字 前 Rd 目 减 一 次 ，32 
位 宽度 


译注 : 上 表 中 , 加 粗 的 是 符合 CM3 堆栈 操作 的 LDM/STM 使 用 方式 。 并 且 , 如 果 Rd 是 R13( 即 SP), 则 POP/PUSH 
指令 等 效 。(LDMIA->POP, STMDB -> PUSH) 


LDMDB.W Rd!， {寄存 器 列表 } 从 Rd 处 读 取 多 个 字 ， 并 依次 送 到 寄存 器 列表 中 的 寄存 
器 。 每 读 一 个 字 前 Rd 自 减 一 次 ，32 位 宽度 
1 ， | 





STMDB SP!，{R0-R3，LR} 等 效 于 PUSH {RO0-R3,， LR} 


LDMIA SP!，{R0-R3，PC} 等 效 于 PUSH {RO0-R3,， PC]} 


Rd 后 面 的 “!” 是 什么 意思 ? 它 表 示 要 目 增 (lncrement) 或 目 减 《Decremem) 基 址 寄存 器 Rd 的 值 ， 时 
机 是 在 每 次 访问 前 (Before) 或 访问 后 (Arer)。 增 / 减 单 位 : 字 (4 字 节 )。 例 如 ， 记 R8=0x8000， 则 下 面 两 
条 指令 : 

STMIA.W R81!, {r0-R3} ; ”R8 值 变 为 0x8010， 每 存 一 次 增 一 次 ， 先 存储 后 目 增 

STMDB.W R8, {RO0-R3} ; ”R38 值 的 "一 个 内 部 复 本 “ 先 目 减 后 再 存储 数据 ， 但 R8 的 值 不 变 


感叹 号 还 可 以 用 于 单一 加 载 与 存储 指令 一 一 LDR/STR。 这 也 就 是 所 谓 的 “ 带 预 索引 ”(Pre-indexing) 
的 LDR 和 STR。 例 如 : 

LDR.W RO, [R1, #20] 项 索引 | 

该 指令 先 把 地 址 RI1+offset 处 的 值 加 载 到 RO0， 然 后 ，R1 娘 R1+ 20 (offset 也 可 以 是 负数 一 一 译 
注 )。 这 里 的 “!” 就 是 指 在 传送 后 更 新 基 址 寄存 器 R1 的 值 。“!” 是 可 选 的 。 如 果 没 有 “!”， 则 该 
站 令 束 是 普通 的 禹 仿 移 量 加 载 指 令 ， 不 会 目 动 调 整 RO 的 值 。 市 预 守 引 的 数据 传送 可 以 用 在 多 种 数 
据 类 型 上 ， 并 且 既 可 用 于 加 载 ， 叉 可 用 于 存储 。 


表 4.16 预 率 5 引 数 据 传送 的 单 见 用 法 
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功能 描述 


rpRsa.W Ra， [Ra， #osfset]! | 字 节 / 半 字 的 带 预 索引 加 载 ， 并 且 在 加 载 后 执行 带 符 
LDRSH.W Rd, [Rn， #offset]! 号 所 展 成 32 位 整数 








CM3 除了 文 持 “ 预 索引 ”外 ， 还 文 持 “ 后 索引 ”(Post-indexing)。 后 索引 也 要 使 用 一 个 立即 数 
offset， 但 与 预 索 引 不 同 的 是 ， 后 索引 忠实 地 使 用 基 址 寄存 喜 Rd 的 值 ， 把 它 作为 传送 的 目的 地 址 。 
待 到 数据 传送 后 ， 再 执行 Rd 入 Rd+offset (offset 可 以 是 负数 一 一 译注 )。 如 : 

STR.W RO, [R1],  #-12 ;后 索引 

该 指令 是 把 RO 的 值 存储 到 地 址 R1 处 的 。 在 存储 完毕 后 ， R1 所 R1+(-12) 

注意 ，[R1] 后 面 是 没有 ”! “的 。 可 见 ， 在 后 索引 中 ， 基 址 宥 存 器 是 无 条 件 被 更 新 的 一 一 也 可 以 
理解 为 有 一 个 “隐藏 ”的 “1!” 





表 4.17 后 系 引 的 单 见 用 法 


功能 描述 


LDRSB.W Rd, [Rn], #offset] 字 节 / 半 字 的 带 预 索引 加 载 ， 并 且 在 加 载 后 执行 带 符 
LDRSH.W Rd, [Rn], #offset] 号 扩展 成 32 位 整数 
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译 者 添加 


立即 数 的 位 数 是 有 限制 的 , 且 不 同 指令 的 限制 可 以 不 同 。 这 下 包 不 是 要 有 的 背 了 ? 其 实 
不 必 ! 因为 如 果 在 使 用 中 超过 了 限制 ， 则 汇编 器 会 报错 ， 所 以 不 用 担心 会 背 成 书 采 子 。 

那 能 彻底 消灭 这 种 限制 吗 ? 办 法 是 有 的 ， 只 是 要 使 用 另 一 种 形式 的 LDR/STR。 事 实 上 ， 
在 CM3 中 的 偏 移 量 ， 除 了 可 以 使 用 形 如 #offset 的 立即 数 ， 还 可 以 使 用 一 个 寄存 器 。 使 用 寄 
存 器 来 提供 偏 移 量 ， 就 可 以 “天 南 地 北 任 我 行 了 。 不 过 ， 如 果 使 用 寄存 器 提供 偏 移 量 ， 就 不 
能 使 用 “ 预 索引 ”和 “后 索引 "了 一 一 也 就 是 说 不 能 修改 基 址 寄存 器 的 值 。 因 此 下 面 的 写法 就 是 
非法 的 : 


ldr 让 [ro0, r3]! ; 错误 ， 寄 存 器 提供 偏 移 量 时 不 支持 预 索 引 
ldr 人 [r0],  r3 ; 错误， 寄存 器 提供 偏 移 量 时 不 支持 后 索引 


这 看 起 来 令 人 扫兴 吗 ? 不 过 也 有 好 消息 。 当 使 用 寄存 器 作 索 引 时 ， 可 以 “ 预 加 工 ” 索 引 


寄存 器 的 值 一 一 逻辑 左 移 。 显 然 ， 这 与 C 语 言 数 组 下 标的 寻 址 方式 刚好 吻合 ， 如 
Idr r2, [roO, r3, lsl #2|] 


译注 : PUSH/POP 作为 堆栈 专用 操作 ， 也 属于 数据 传送 指令 类 。 

通常 PUSH/POP 对 子 的 寄存 器 列表 是 严格 一 致 的 ， 但 是 PC 与 LR 的 使 用 方式 有 新 意 ， 如 
; 子 程 序 入 口 

PUSH {RO-R3, LR} 














; 子 程序 出 口 
POP {RO-R3, PC} 


在 这 个 例子 中 ， 和 劳 路 了 LR， 直 帘 了 当地 返回 。 


数据 传送 指令 还 包括 MRS/MSR。 还 记得 第 3 章 讲 到 过 CM3 有 若干 个 特殊 功能 寄存 器 吗 ? 
MRS/MSR 残 是 专门 用 于 访问 这 些 寄 存 器 的 。 不 过 , 这 些 寄存 器 都 是 维持 系统 正常 工作 的 重地 , 因此 ， 
按理 说 是 不 能 允许 随意 访问 它们 的 。 然 而 , 在 CM3 上 , 它们 是 “春色 满 园 关 不 住 ， 一 术 红 杏 出 墙 来 ” 
一 一 大 原则 是 必须 在 特权 级 下 才 允 许 访问 ， 以 免 系 统 因 误 操 作 或 恶意 令 坏 而 功能 系 乱 ， 可 是 APSR 却 
允许 在 用 户 级 下 访问 ， 想 必 是 为 了 让 我 们 有 妙用 非 主流 技 马 的 余地 吧 。CM3 的 这 个 禁 律 是 由 便 件 强 
制 执行 的 ， 如 果 在 用 户 级 下 以 里 试 法 ， 则 fault 伺 修 (产生 MemManage fault， 奉 被 除 能 则 “ 上访” 成 
便 fault) rx] 。 通 常 ， 只 有 系统 软件 (如 O05) 才 会 操作 这 类 寄存 器 ， 应 用 程序 ， 尤 其 是 用 C 编 写 的 
应 用 程序 ， 是 从 来 不 关心 这 些 的 。 

译注 : 当 使 用 MRS 访问 APSR 时 ,是 把 各 个 标志 位 按照 它们 在 xPSR 中 占用 的 位 序号 ,直接 复制 到 寄存 器 中 的 。 
例如 ， 进 位 标志 C 是 在 xPSR.30 中 ， 在 执行 了 MRS RO0, APSR 指令 后 ， 则 R0.30=C; 反之 亦 然 ， 欲 设置 C 位， 必须 在 
R0.30 中 给 出 新 的 C 的 值 。 另 外 ， 译 者 在 模拟 器 和 STM32 单片机 中 尝试 了 在 用 户 级 下 访问 PSR， 并 没有 产生 fault， 
只 是 改写 APSR 以 外 的 部 分 被 忽略 而 已 。 但 我 觉得 不 必 太 过 争论 处 理 器 的 具体 处 理 方式 ， 因 为 不 管 怎么 说 这 都 是 错误 
的 编程 行为 。 

下 和 耐 轮 到 立即 数 上 场 。 代 码 写 多 了 我 们 就 党 常会 感觉 到 ， 程 序 中 会 经 党 使 用 江 即 数 。 最 典型 的 
就 是 : 当 我 们 要 访问 某 个 地 址 时 ， 必 须 先 把 该 地 址 加 载 到 一 个 寄存 器 中 ， 这 束 包 含 了 一 个 32 位 六 
即 数 加 载 操 作 。CM3 中 的 MOV/MVN 指令 族 负 责 加 载 立 即 数 , 族 中 各 个 成 员 文 持 的 立即 数位 数 不 同 。 
例如 ，16 位 指令 MOV 文 持 8 位 立即 数 加 载 ， 如 : 
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MOV RO, #0xl12 

32 位 指令 MOVW 和 MOVT 可 以 支持 16 位 立即 数 加 载 。 

那 要 加 载 32 位 立即 数 怎 么 办 呢 ? 如 果 要 直 来 直 去 ， 当 前 是 要 用 两 条 指令 来 完成 了 。 通 过 组 合 
使 用 MOVW 和 MOVT 束 能 产生 32 位 立即 数 ， 但 是 要 注意 ， 必 须 先 使 用 MOVW， 再 使 用 MOVT。 这 
种 顺序 是 不 能 颠倒 的 ， 因 为 MOVW 会 清 零 高 16 位 。 

不 过 ， 更 流行 的 是 另 一 种 方法 : 使 用 汇编 器 提供 的 "LDR ”Rd, = imm32” 伪 指令 。 例 如 : 

LDR, EO =0xl12345678 

酷 吧 ! 它 的 名 字 也 是 LDR, 而 且 能 加 载 32 位 立即 数 ! 但 可 别 筷 了 , 它 是 伪 指 令 , 是 “妖怪 变 的 ”， 
而 且 有 才干 种 原形 。 所 以 不 要 因为 名 字 相 同 束 混 消 。 

大 多 数 情 况 下 ， 当 汇编 右 遇 到 LDR 伪 指 令 时 ， 都 会 把 它 转换 成 一 条 相对 于 PC 的 加 载 指令 ， 来 
产生 需要 的 数据 。。 大 可 依赖 汇编 器， 它 会 明智 地 使 用 最 合适 的 形式 来 实现 该 伪 指 令 。 

译 者 添加 : 如 果 某 指令 需要 使 用 32 位 立即 数 ， 可 以 在 该 指令 地 址 的 附近 定义 一 个 32 位 整数 数组 ， 
把 这 个 立即 数 放 到 该 数组 中 。 然 后 使 用 一 条 LDR Rd, [PC, #offset| 来 查 表 。offset 的 值 需要 计算 ， 它 
其 实 是 LDR 指令 的 地 址 与 该 数组 元 素 地 址 的 距离 。 手 工 计 算 offset 是 很 自 度 的 作法 ， 而 刚才 讲 到 的 
LDR 伪 指 令 则 能 让 汇编 器 来 自动 产生 这 种 数组 ， 并 且 负 责 计 算 offset。 这 种 数组 被 广泛 使 用 ， 它 的 
学 名 叫 “ 文 字 池 ”(literal pool) ,通常 由 汇编 器 自动 布设 ,汇编 程序 很 大 时 可 能 也 需要 手工 布设 (通过 
LIORG 指示 字 )。 

















LDR 伪 措 令 vs。 ADR 伪 措 令 


Both LDR 和 ADR 都 有 能 力 产 生 一 个 地 址 ， 语 法 和 行为 都 有 相似 处 ， 但 却 不 尽 相 同 。 对 于 LDR， 
如 果 汇 编 嚣 发 现 要 产生 立即 数 是 一 个 程序 地 址 ， 它 会 自动 地 把 LSB 置 位 ， 例 如 : 
LDR r0, =dddressl » RO= 0x4000 | 1 











addressl 
Ox4000: MOV RO, RL1 

在 这 个 例子 中 ， 汇 编 右 会 认 出 address1 是 一 个 程序 地 址 ， 所 以 目 动 置 位 LSB。 为 一 方面 ， 如 果 
汇编 器 发 现 要 加 载 的 是 数据 地 址 ， 则 不 会 日 作 联 明 ， 多 机 灵 啊 ! 看 : 





Be RO, =adqress1 ; 会 把 0x4000 原封 不 动 地 加 载 到 RO 
addressl 
0x4000: DCD Ox0 ; 0x4000 处 记录 的 是 一 个 数据 





ADR 指令 则 永远 是 “ 囊 厚 ”的 ， 它 决 不 会 擅自 修改 LSB。 例 如 : 
ADR ro, addressl  ; R0= 0x4000。 注 意 : 没有 “=” 与 


addressl 
Ox4000: MOV RO, R1 

ADR 将 如 实地 加 载 0x4000。 注 意 ， 语 法 略 有 不 同 ， 没 有 “=” 号 。 

前 面 已 经 所 到 ，LDR 通 第 是 把 要 加 载 的 数值 预 完 定 义 ， 再 使 用 一 条 PC 相对 加 载 指令 来 取出 。 而 
ADR 则 答 试 对 PC 作 算术 加 法 或 减法 来 取得 立即 数 。 因 此 ADR 未 必 总 能 求 出 需要 的 立即 数 。 其 实 顾 
名 思 义 ，ADR 是 为 了 取出 附近 霖 条 指令 或 者 变量 的 地 址 ， 而 LDR 则 是 取出 一 个 通用 的 32 位 整数 。 
因为 ADR 更 专 一 ， 所 以 得 到 了 优化 一 一 它 产 生 的 代码 效率 币 弟 比 LDR 的 要 高 。 
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4.3.2 汇编 语言 : 数据 处 理 


数据 处 理 力 是 处 理 占 的 看 家 本 领 ，CM3 当然 要 出 类 披 茶 ， 它 提供 了 丰富 多 彩 的 相关 指令 ， 每 种 
引信 的 用 法 也 是 化 样 日 出 。 限 于 篇幅 ， 这 里 只 列 出 利用 的 使 用 方式 。 束 以 加 法 为 例 ， 币 匈 的 有 : 











ADD RO, R1 ; RO += R1 
ADD RO, #0x12 ; RO += 12 
ADD.W RO0O, R1, R2 ; RO = R1+R2 





注意 : 虽然 助 记 符 都 是 “ADD”， 但 是 二 进 制 机 器 码 是 不 同 的 。 
当 使 用 16 位 加 法 时 ， 会 目 动 更 新 APSR 中 的 标志 位 。 然 而 ， 在 使 用 了 “WW” 显 式 指定 了 32 位 
指令 后 ， 束 可 以 通过 “Ss” 后 级 手工 控制 对 APSR 的 更 新 ， 如 : 








ADD.W RO, Rl R2 ; 不 更 新 标志 位 
ADDS .W RO, R1, R2 ; 更 新 标志 位 


除了 ADD 指令 之 外 ，CM3 中 还 包含 SUB, MUL UDIV/SDIV 等 用 于 算术 四 则 运算 ， 如 表 4.18 所 列 
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表 4.18 单 见 的 算术 四则 运算 指令 


功能 描述 


Rn+Rm+C 市 进位 的 加 法 
Rm+C imm 的 范围 是 im8(16 位 指令 ) 或 im12(32 


位 指令 ) 


常规 减法 


乘 加 与 乘 减 
〈 译 者 添加 ) 





CM3 还 斤 载 了 便 件 乘法 堪 ， 文 持 乘 加 / 乘 减 指令 ， 并 且 能 产生 64 位 的 积 ， 如 表 4.19 所 未 


表 4.19 ”64 位 乘法 指令 


功能 描述 


UMULL RL, RH, Rm, Rn ; [RH:RL]= Rm*Rn 无 符号 的 64 位 乘法 


SMLAL RL, RH, Rm, Rn ; [RH:RL]+= Rm*Rn 
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逻辑 运算 以 及 移 位 运算 也 是 基本 的 数据 操作 。 表 4.20 列 出 CM3 在 这 方面 的 常用 指令 


表 4.26 ” 弟 用 逻辑 操作 指令 


按 位 或 反 码 
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译 者 添加 


大 多 数 涉及 3 个 寄存 器 的 32 位 数据 操作 指令 ,都 可 以 在 计算 之 前 ,对 其 第 3 个 操作 数 Rn 进行 “ 预 


加 工 一 一 移 位 ， 格式 为 : 


Dataop 
Dataop 
Dataop 
Dataop 


DataoOp 


Rd, 
Rd, 
Rd, 
Rael 


Rd, 


Rm, 


Rny, 


LSL #imm5 
LSR #1imm5 
ASR #1imm5 


ROR #imm5 


RRX 


; 先 对 Rn 逻辑 左 移 imm5 格 
; 先 对 Rn 凶 辑 右 移 imm5 格 
; 先 对 Rn 算术 右 移 imm5 格 
; 先 对 Rn 圆圈 右 移 imms5 格 


; 先 对 Rn 市 进位 位 右 移 一 格 


注意 :“ 预 加 工 “ 是 对 Rn 的 一 个 “内 部 复 本 ”执行 操作 , 不 会 因此 而 影响 Rn 的 值 。 但 如 果 Rn 正巧 也 


CM3 还 文 持 为 数 众 多 的 移 位 运算 。 移 位 运算 既 可 以 与 其 它 








令 组 合 使 用 传送 指 令 和 数据 操作 指令 


中 的 一 些 ， 参 见 文 本 框 中 的 说 明 )， 也 可 以 独立 使 用 ， 如 表 4.21 所 示 。 


66 


Cortex-M3 权威 指南 第 4 章 


表 4.21 ” 移 位 和 循环 指令 


功能 描述 


Rn ， ; 逻辑 左 移 

Rn 2 

Rm, 

Rn, . 逻辑 石 移 
Rn . >>= Rn 
Rm, ， Rm>>Rn 
Rn, 9 A 
Rn 9 = 
Rm, 
Rn , 
Rm, 
Rn 


算术 右 移 


圆圈 右 移 


RRX.W (Rn>>1) + (C<<31) 带 进位 的 右 移 一 格 
译 者 添加 亦 可 写作 RRX{S} Rd 。 此 时 ，Rd 
(因为 在 RRX 上 使 用 s 后 缀 比较 特殊 ， 故 提出 来 单独 讲解 ) 也 要 担当 Rn 的 角色 一 一 译注 


RRXS.W Rd, Rn ; tmpBit = Rn & 1 
; Rd = (Rn>>1)+(C<<31) 
; C= tmpBit 


如 果 在 移 位 和 循环 指令 上 加 上 “Ss” 后 级 , 这 些 指令 会 更 新 进位 位 C。 如 虹 是 16 位 Thumb 指令 ， 
则 总 是 更 新 Cc 的 。 图 4.1 给 出 了 一 个 直观 的 印象 


RS 0 


仅 当 使 用 Ss 后 综 ， 或 者 使 用 16 位 指令 时 ， 才 更 新 C 位 














4.1 ” 移 位 与 循环 指令 


| 
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为 什么 没有 圆圈 元 移 ? 


在 圆 财 移 位 中 ， 寄存 鼎 的 32 个 位 其 实 是 手 拉 手 组 成 一 个 背 的 。 那 么 这 个 阎 加 石 转 
动 n 格 ， 与 向 左 转 动 32-n 格 是 等 效 的 。 这 种 简单 的 道理 ， 玩 过 “于 手绢 ”的 小 朋友 
们 都 知道 。 因 此 和 欲 圆 罗 堪 移 mn 格 时 , 只 要 使 用 圆 效 右 移 指令 , 并 且 转 动 32-n 格 即 可 。 





介绍 完了 移 位 指令 ， 接 下 来 讲 市 符号 扩展 指令 。 

我 们 知道 ， 在 2 进 制 补 码 表示 法 中 ， 最 高 位 是 符号 位 ， 且 所 有 负数 的 符 扎 位 都 是 1。 人 负数 还 有 
为 一 个 性 质 ， 就 是 不 官 在 符 写 位 的 前 面 再 洪 加 多 少 个 1， 值 都 不 变 ， 上 只 不 过 表达 市 符号 整数 的 位 数 
增多 了 。 于 是 ， 在 把 一 个 8 位 或 16 位 负数 扩展 成 32 位 时 ， 欲 使 其 数值 不 变 ， 束 必须 把 所 有 新 增 的 
局 位 全 填 1。 人 至 于 正 数 或 无 符号 数 ， 则 只 需 简 单 地 把 新 增 的 高 位 清 0。 因此， 必须 给 市 符号 数 开 小 
灶 ， 于 是 残 有 了 整数 扩展 指 仿 ， 如 表 4.22 所 示 。 

















功能 描述 
SXTH Rd，Rm  ; Rd = Rm 的 带 符号 扩展 把 带 符 号 半 字 整数 扩展 到 32 位 


我 们 知道 ，32 位 整数 可 以 被 认为 是 由 4 个 字 贡 拼接 成 的 ， 也 可 以 被 认为 是 2 个 半 字 拼接 成 的 。 
有 时 ， 需 要 把 这 些 子 元 系 倒 腾 倒 腾 ， 如 表 4.23 所 示 


表 4.23 ”数据 序 翻 转 指令 





功能 描述 





TE 





这 些 指令 乍 一 看 不 太 好 理解 ， 但 相信 看 过 图 4.2 后 束 会 窜 然 开朗 了 : 
Bit Bit Bit Bit 
[31:24] [23:16] [15:8] [7:0] 


REV.W 


REV16.W 


[| 






REVSH.W 





some | | 人 
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图 4.2 反 序 操作 





数据 操作 指令 的 最 后 一 批 ， 是 位 操作 指令 。 位 操作 在 单片机 程序 中 ， 以 及 在 系统 软件 中 应 中 党 
常 大 显 身手 ， 而 且 在 使 用 这 类 指令 时 ， 有 很 多 新 奇 但 是 却 妙用 横生 的 技巧 。 这 里 在 表 4.24 中 先 列 出 
它们 ， 本 书 在 后 续 的 小 节 中 还 要 展开 论述 。 


表 4.24 ”位 段 处 理 及 把 玩 指 令 
功能 描述 
| 


BFC.W Rd, Rn, #<width> 








计算 前 导 0 的 数目 
SBFX.W Rd, Rn, #<lsb>, #<width> 





4.3.3 ”汇编 语言 : 子 程 呼 叫 与 无 条 件 跳 转 指令 


3 
最 基本 的 无 条 件 跳 转 指 令 有 两 条 : 
B Label ; 跳 转 到 Label 处 对 应 的 地 址 
BX reg 7 路 转 到 由 寄存 器 reg 给 出 的 地 址 








在 BX 中 ，reg 的 最 低位 指示 出 在 转移 后 将 进入 的 状态 : 是 ARM(LSB=0) 呢 ， 还 是 Thumb(LSB=1)。 
既然 CM3 只 在 Thumb 中 运行 ， 就 必须 保证 reg 的 LSB=1， 和 否则 一 个 fault 打 过 来 。 
呼叫 子 程序 时 ， 需 要 保存 返回 地 址 ， 正 点 的 指令 是 : 











BL Label ; 跳 转 到 Label 对 应 的 地 址 ， 并 且 把 跳 转 前 的 下 条 指令 地 址 保存 到 LR 
BLX reg ; 跳 转 到 由 寄存 堪 reg 给 出 的 地 址 ， 并 根据 REG 的 LSB 切换 处 理 需 状态 ， 


; 还 要 把 转移 前 的 下 条 指令 地 址 保存 到 LR 
执行 这 些 指令 后 ， 就 把 返回 地 址 存储 到 LR (R14) 中 了 ， 从 而 才能 使 用 "BX LR”" 等 形式 返回 。 
使 用 BLX 要 小 心 ， 因 为 它 还 带 有 改变 状态 的 功能 。 因 此 reg 的 LSB 必须 是 1， 以 确保 不 会 试图 进 

入 ARM 状态 。 如 果 访 记 置 位 LSB， 则 fault 伺候 。 
对 于 亏 高 胆 大 的 玩家 来 说 ， 使 用 以 PC 为 目的 寄存 右 的 MOV 和 LDR 指令 也 可 以 实现 转移 ， 并 且 
往往 能 借 此 实现 很 多 “老实 ”的 程序 达 不 到 的 功效 ， 和 常见 形式 有 : 








MOV Rn ; 转移 地 址 由 Rn 给 出 
LDR BC [Rn] ; 转移 地 址 存储 在 Rn 所 指向 的 存储 器 中 
POP Oe ; 把 返回 地 址 以 弹出 堆栈 的 风格 送 给 PC， 
; 从 而 实现 跳 转 ， 这 也 是 比较 平易 近 人 的 技巧 
LDMIA Sel; {…，PC} ;POP 的 另 一 种 等 效 写 法 


同 理 ， 使 用 这 些 技巧 ， 你 也 必须 保证 送 给 PC 的 值 必 须 是 奇数 〈LSB 王 1)。 

注意 : 有 心 的 读者 可 能 已 经 发 现 ，ARM 的 BL 虽然 省 去 了 耗 时 的 访 内 操作 ， 却 只 能 支持 一 级 子 
程序 调用 。 如 果子 程序 再 呼叫 “ 孙 程 序 ” 则 返回 地 址 会 被 尾 新 。 因 此 当 函 数 舱 套 多 于 一 级 时 ， 必 
须 在 调用 “和 孙 程序 ”之 前 先 把 LR 压 入 堆栈 一 一 也 就 是 所 谓 的 “ 溅 出 ”。 
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| 


4.3.4 ”汇编 语言 : 标志 位 与 条 件 转移 


在 应 用 程序 状态 寄存 磊 中 有 5 个 标记 位 ， 但 只 有 4 个 被 条 件 转 移 指 令 参 考 。 绝 大 多 数 ARM 的 
条 件 转移 指令 根据 它们 来 决定 是 盏 转移 ， 如 表 4.25 所 示 





表 4.25 Cortex-M3 APSR 中 可 以 影响 条 件 转移 的 4 个 标志 位 


(上 一 次 操作 的 结束 是 个 负数 )。N= 操 作 结 果 的 MSB 

零 〈 上 次 操作 的 结果 是 0)。 当 数据 操作 指令 的 结果 为 0, 或 者 比 
绞 / 测 试 的 十 果 为 0 时 ，z 置 位 。 
进位 / 价位 (上 次 操作 导致 了 进位 或 者 价位 )。C 用 于 无 符号 数据 











处 理 , 最 常见 的 就 是 当 加 法 进位 及 减法 借 位 时 c 被 置 位 。 此 外 ，c 
还 充当 移 位 指令 的 中 介 ( 详 见 v7M 参考 手册 的 指令 介绍 节 )。 

溢出 〈 上 次 操作 结果 导致 了 数据 的 溢出 )。 该 标志 用 于 带 符 号 的 数 
据 处 理 。 比 如 , 在 两 个 正 数 上 执行 ADD 运算 后 ， 和 的 MSB 为 1( 视 
作 负 数 )， 则 V 置 位 。 




















ARM 中 ， 数 据 操 作 指令 可 以 更 独 这 4 个 标记 人 位。 这些 标志 位 除了 可 以 当 作 条 件 转 移 的 判 据 
之 外 ， 还 能 在 一 些 场合 下 作为 指令 是 否 执行 的 依据 《〈 详 见 If-Then 指令 块 )， 或 者 在 移 位 操作 中 充当 
vy po 〈 仅 进位 位 C)。 














担任 条 件 跳 转 及 条 件 执 行 的 判 据 时 ， 这 4 个 标记 位 既 可 单独 使 用 ， 叉 可 组 合 使 用 ， 以 产生 共 15 
种 路 转 判 据 ， 如 下 表 4.26 所 未 


表 4.26 ” 跳 转 及 条 件 执行 判 据 


关系 到 的 标志 位 
0 | | 
En rr sn 


CS/HS oe (CarrySet) 
无 符号 数 遍 于 或 相同 

CC/LO | 未 进位 (CarryClear) C==0 
无 从 写 数 低 于 


I | 负数 (MInus) 











EE 
和 
Eee 


符号 数 小 于 等 sos 
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带 符号 数 小 于 等 于 :|| 
是 


、 
ar | 总 是 | 


表 中 共有 15 个 条 件 组 合 (AL 相当 于 无 条 件 一 一 详 注 )， 通 过 把 它们 点 级 在 无 条 件 转 移 指 令 〈(B) 的 
后 面 ， 即 可 做 成 各 式 各 样 的 条 件 转移 指令 ， 例 如 : 

BEQ label ; 当 Z=1 时 转移 

亦 可 以 在 指令 后 面 加 上 “WW”, 来 强制 使 用 Thumb-2 的 32 位 指令 来 做 更 远 的 转移 (其 实 没 必要 ， 
沪 编 占 会 目 行 判 断 一 一 详 注 )， 例 如 : 











BEQ.W label 

这 些 条 件 组 合 还 可 以 用 在 If-Then 语句 块 中 ， 比 如 : 

CMP RO, R1 ; 比较 RO, R1 

ITTET GT ;If RO>R1 Then (T 代 表 Then，E 代 表 Else) 
MOVGT R2, RO 

MOVGT R3, R1 

MOV R2 RO 

MOVGT R3, R1 





《本 草 的 后 面 有 对 IT 指令 和 If-Then 块 进行 详细 说 明 。 请 留意 上 例 中 对 字体 和 格式 的 严格 使 用 一 一 诺 注 ) 











在 CM3 中 ， 下 列 指 令 可 以 更 新 PSR 中 的 标志 : 
16 位 算术 岂 辑 指令 

@ 32 位 市 $ 后 级 的 算术 逻辑 指令 

@ 比较 指令 (如 ，CMP/CMN)〉 和 测试 指令 (如 TST/TEQ) 

@ 直接 写 PSR/APSR (MSR 指令 ) 

大 多 数 16 位 算术 逻辑 指令 不 由 分 说 束 会 更 狐 标 志 位 (不 是 所 有 的 16 位 指令 都 这 样 , 例 H ADD.N Rd, Rn, 
Rm 是 16 位 指令 ， 但 不 更 新 标志 位 译注 )，32 位 的 都 可 以 让 你 使 用 后 级 来 控制 。 例 如 : 


























ADDS .W R0，R1，R2 ;使 用 32 位 Thumb-2 指令 ， 并 更 新 标志 

ADD .W R0，R1，R2 ;使 用 32 位 Thumb-2 指令 ， 但 不 更 新 标志 位 

ADD RO, Rl ;使 用 16 位 Thumb 指令 ， 无 条 件 更 新 标志 位 

ADDS R0， #0xcd ;使 用 16 位 Thumb 指令 ， 无条件 更 新 标志 位 

译注 : 虽然 真实 指令 的 行为 如 上 所 述 。 但 是 在 你 用 汇编 语言 写 代码 时 ， 如 果 使 用 了 UAL〔 统 一 汇编 语言 )， 汇 











编 器 会 做 调整 ， 最 终生 成 的 指令 不 一 定 和 与 你 在 字面 上 写 的 指令 相同 。 对 于 ARM 汇编 器 而 言 ， 调 整 的 结果 是 : 如 果 
没有 写 后 级 Ss， 汇编 器 就 一 定 会 产生 不 更 新 标志 位 的 指令 。 可 见 ， 使 用 UAL 的 一 大 好 处 ， 就 是 我 们 完全 能 控制 是 否 
更 新 标志 位 ， 决 不 会 出 现 标志 位 被 意外 更 新 的 情况 。 











Ss 后 级 的 使 用 要 当心 。16 位 Thumb 指令 可 能 会 无 条 件 更 新 标志 位 ， 但 也 可 能 不 更 新 标志 位 。 为 
了 让 你 的 代码 能 在 不 同 汇编 堪 下 有 相同 的 行为 , 当 你 需要 更 新 标志 ， 以 作为 条 件 指令 的 执行 判 据 时 ， 
一 定 不 要 环 记 加 上 后 级 。 

CM3 中 还 有 比较 和 测试 指令 , 它们 存在 的 目的 就 是 更 新 标志 位 , 因此 是 会 无 条 件 影响 标志 位 的 ， 
如 下 所 述 。 

CMP 指令 。CMP 指令 在 内 部 做 两 个 数 的 减法 ， 并 根据 差 来 设置 标志 位 ， 但 是 不 把 差 号 回 。CMP 
可 有 如 下 的 形式 : 

CMP RO, R1 ; 计算 RO0-R1 的 去 ， ”并且 根据 结果 更 新 标志 位 

CMP RO 0x12 ” ;计算 R0-0x12 的 差 ， 并 且 根 据 结 果 更 狐 标 志 位 

CMN 指令 。CMN 是 CMP 的 一 个 杰 生 姊妹 ， 只 是 它 在 内 部 做 两 个 数 的 加 法 (相当 于 减 去 减 数 的 
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相反 数 )， 如 下 所 示 : 

CMN RO R1 ; 计算 RO+R1 的 和 ， 并 根据 结果 更 新 标志 位 

CMN RO, 0x12 ” ，; 计算 RO+0x12 的 和 ， 并 根据 结果 更 新 标志 位 

TST 指令 。TST 指令 的 内 部 其 实 就 是 AND 指令 ， 只 是 不 写 回 运算 结果 ， 它 也 无 条 件 更 新 标志 位 。 
它 的 用 法 与 CMP 的 用 法 相同 : 

TS RO, R1 ; 计算 RO & R1， 并 根据 结果 更 新 标志 位 

TST RO, 0x12  ; 计算 RO & 0x12， 并 根据 结果 更 新 标记 位 

TEQ 指令 。TEQ 指令 的 内 部 其 实 就 是 EOR 指令 , 只 是 不 写 回 运算 结果 , 它 也 无 条 件 更 新 标志 位 。 
它 的 用 法 与 CMP 的 用 法 相同 : 

TEQ RO, R1 ; 计算 RO ^ R1， 并 根据 结果 更 新 标志 位 

TEQ RO, 0x12 ;计算 RO ^ 0x12， 并 根据 结果 更 狐 标 志 位 
























































4.3.5 “汇编 语言 :指令 隔离 (barrier) 指 令 和 存储 器 隔离 指令 


CM3 中 的 男 一 股 独 鲜 空气 是 一 系列 的 隔离 指令 (认可 以 译 成 “屏障 ””“ 路 障 ” 可 互 换 使 用 一 一 译 者 
注 。 它 们 在 一 些 结构 比较 复 琳 的 存储 絮 系 统 中 是 需要 的 (典型 地 用 于 流水 线 和 与 绥 冲 一 一 详 者 注 )。 在 
这 类 系统 中 ， 如 果 没 有 必要 的 隔离， 会 导 铬 系统 发 生 茶 乱 危 象 〈race condition)，(〈 相 当 于 数 电 中 的 “竞争 
与 冒险 "一 一 译 者 注 ) . 

举例 来 说 ， 如 果 可 以 在 运行 时 更 改 存储 器 的 映射 关系 或 者 内 存 保护 区 的 设置 ,〈 通 过 写 MPU 的 寄存 
器 )， 束 必须 在 更 改 之 后 立即 补 上 一 条 DSB 指令 (数据 同步 指令 )。 因 为 对 MPU 的 写 操作 很 可 能 会 被 放 
到 一 个 写 绥 冲 中 。 写 绥 冲 是 为 了 提 融 存储 右 的 总 体 访问 效率 而 设 的， 但 它 也 有 副作用 ， 其 中 之 一 ， 就 是 
会 叶 任 写 内 存 的 指令 被 延迟 儿 个 周期 执行 ， 因 此 对 存储 器 的 设置 不 能 即刻 生效 ， 这 会 导致 紧 临 者 的 下 一 
条 指令 仍然 使 用 旧 的 存储 器 设置 一 一 但 程序 员 的 本 曹 显 然 是 使 用 狐 的 存储 器 设置 。 这 种 茶 乱 危 象 是 后 患 
无 穷 的 ， 第 会 破坏 未 知 地 址 的 数据 ， 有 时 也 会 产生 非法 地 址 访问 fault。 亲 乱 危 象 还 有 其 它 的 表现 形式 ， 
后 续 和 章节 会 一 一 介绍 。CM3 提供 隔离 指令 族 ， 就 是 要 消炎 这 些 亲 乱 危 销 (在 有 些 讲解 计算 机 体系 体系 结 
构 的 书 中 ， 这 类 闪 乱 危 象 也 被 称 为 “存储 器 相关 ”一 一 译注 )。 

CM3 中 共有 3 条 隔离 指令 ， 如 表 4.27 所 列 












































表 4.27 隔离 指令 
数据 存储 器 隔离 。DMB 指令 保证 : 。 仅 当 所 有 在 它 前 面 的 存储 器 访问 操作 
都 执行 完毕 后 ， 才 提交 (commit) 在 它 后 面 的 存储 器 访问 操作 。 











问 操作 一 一 译 者 注 ) 
指令 同步 隔离 。 最 严格 : 它 会 清洗 流水 线 ， 以 保证 所 有 它 前 面 的 指令 都 执 
行 完 毕 之 后 ， 才 执行 它 后 面 的 指令 。 





数据 同步 隔离 。 比 DMB 严格 : 仅 当 所 有 在 它 前 面 的 存储 露 访 问 操作 
祁 执 行 完 侍 后 ， 才 执行 在 它 后 面 的 指令 《人 尔 即 任何 指令 都 要 等 竺 存储 需 访 








DMB 在 双 口 RAM 以 及 多 核 架 构 的 操作 中 很 有 用 。 如 果 RAM 的 访问 是 带 缓 冲 的 ， 并 且 写 完 之 后 
马上 读 , 束 作 须 让 它 “ 颗 口气 ”一 一 用 DMB 指令 来 隔离 ， 以 保证 缕 冲 中 的 数据 已 经 浪 实 到 RAM 中 。 
DSB 比 DMB 更 保险 (当然 也 是 有 执行 代价 的 )， 它 是 宁可 错 杀 也 不 漏网 一 一 清空 了 写 缓冲 ， 使 得 任 
何 它 后 面 的 指令 ， 不管 要 不 要 使 用 先前 的 存储 器 访问 结果 ， 通 通 等 待 访问 完成 。 大 是 们 可 以 在 有 绝 
对 信心 时 使 用 DMB， 新 手 还 是 使 用 DSB 比较 保险 。 

同 DMB/DSB 相 比 , ISB 指令 看 起 来 似乎 最 强悍 , 但 是 却 一 身 都 是 “ 惕 劲 ”不 由 分 说 束 “ 动 粗 ”。 
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不 过 它 还 有 其 它 的 用 场 一 一 对 于 高 级 撒 层 技巧 :“ 目 我 更 新 ”(self-mofifying) 代 码 ， 非 苘 有用。 举例 
来 说 ， 如 条 东 个 程序 从 下 一 条 要 执行 的 指令 处 更 新 了 目 己 ， 但 是 先前 的 旧 指 令 已 经 被 预 取 到 流水 线 
中 去 了 ， 此 时 就 必须 清洗 流水 线 ， 把 旧版 本 的 指令 洗 出 去 ， 再 预 取 新 版 本 的 指令 。 因 此 ， 必 须 在 被 
更 新 代码 段 的 前 面 使 用 ISB， 以 保证 旧 的 代码 从 流水 线 中 被 清洗 出 去 ， 不 再 有 机 会 执行 “ 详 者 觉得 
这 种 做 法 太 工 于 技巧 ， 有 扣 “ 作 夯 *”， 现 实 编 程 中 应 该 极 少 会 用 到 ， 因 此 读者 不必 太 销 它 )。 


4.3.6 汇 编 语 言 ， 饱 和 运算 


饱和 运算 可 能 是 读者 在 以 前 不 太 听 说 的 。 不 过 其 实 很 简单 。 如 采访 者 学 过 模 电 ， 或 者 知道 放大 
电路 中 所 谓 的 “饱和 前 项 失真 ”， 理 解 饱和 运算 融 更 加 容易 。 而 且 饱 和 运算 指令 确实 是 打算 用 于 信 
号 处 理 程序 的 。 

CM3 中 的 饱和 运算 指令 分 为 两 种 : 一 种 是 “没有 直流 分 量 ” 的 交流 信号 饱和 一 一 带 符 号 亿 和 运 
算 ; 为 一 种 无 人 特写 饱和 运算 则 类 似 于 “ 痢 顶 失真 十 蛙 问 导 通 ”。 

饱和 运算 多 用 于 信号 处 理 。 比 如 ， 信 号 放大 。 当 信和 号 被 放大 后 ， 有 可 能 使 它 的 幅 值 超出 允许 输 
出 的 范围 。 如 来 傻乎乎 地 只 十 清除 MSB， 则 党 第 会 严重 破坏 信和 写 的 波形 ， 而 饱和 运算 则 只 是 使 信号 


产生 削 顶 失真 。 如 图 4.3 所 示 。 
未 做 饱和 护理 
的 结果 
0 






























































图 4.3 ” 带 符 号 饱和 运算 








可 见 ， 饱 和 运算 的 “护理 ”虽然 不 能 消灭 失真 ， 但 那 种 委 琐 的 变形 是 可 以 消灭 的 。 表 4.28 列 出 饱和 
运算 指令 。 
表 4.28 ”饱和 运算 指令 





Rd, #imm5, Rn, {,shift)} 以 市 符号 数 的 边界 进行 饱和 运算 〈 交 
流 ) 


SSRAT .W Rd, #imm5, Rn, {, shift)} 以 无 符号 数 的 边界 进行 饱和 运算 〈 计 
级 让 的 直流 ) 











饱和 运算 的 结果 可 以 拿 去 更 新 Q 标 志 ( 在 APSR 中 。Q 标志 在 写 入 后 可 以 用 软件 清 0 一 一 通过 写 APSR 


一 一 还 记得 APSR 是 “ 红 奋 出 墙 ” 的 吗 ”? 
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Rn 存储 “放大 后 竺 做 饱和 运算 的 信号 ”Rn 总 是 32 位 市 符号 整数 一 一 详 者 注 )。 同 很 多 其 它 数据 
操作 指令 类 似 ，Rn 也 可 以 使 用 移 位 来 “ 预 加 工 ” 


Rd 存储 饱和 运算 的 结 


#imm5 用 于 指定 饱和 边界 一 一 该 由 多 少 位 的 带 符 所 整数 来 表达 人 允许 的 范围 《奇数 也 可 以 使 用 )， 取 
值 范 围 是 1 一 32。 举 例 来 说 , 如 果 要 把 一 个 32 位 (市 符号 ) 整 数 饱 和 到 12 位 带 符 号 整数 (-2048 全 2047)， 
则 可 以 如 下 使 用 SSAT 指令 

SSAT{.W)} | 间 上 2 RO 


这 条 指令 对 于 RO 不同 值 的 执行 结 来 如 表 4.29 所 未 
表 4.29 ” 带 符号 饱和 运算 的 示例 运算 结果 


输入 (RO0) 输出 (R1) Q 标志 位 

0x2000(8192) Ox7FF(2047) 1 

0x537(1335) 0x537(1335) 无 变化 

Ox7FF(2047) Ox7FF(2047) 无 变化 

0 0 天 要 化 

OxFFFFE000(-8192) OxFFFFF800(-2048) 1 

OxFFFFFB32(-1230) OxFFFFFB32(-1230) 无 变化 
如 果 需 要 把 32 位 整数 饱和 到 无 符号 的 12 位 整数 〈0-4095)， 则 可 以 如 下 使 用 USAT 指令 
USAT{.W} Rl1, #12, RO 


该 指令 的 执行 情况 如 图 4.4 演示 








未 做 无 付 号 
饱和 护理 


















做 了 无 侍 号 
饱和 护理 


图 4.4 ”无 符号 饱和 运算 
表 4.30 ”无 符号 饱和 运算 的 示例 运算 结 


输入 (RO) 输出 (R1) Q 标志 位 
0x2000(8192) OxFFF(4095) 1 
OxFFF(4095) OxFFF(4095) 无 变化 
0x1000(4096) OxFFF(4095) 1 
0x800(2048) 0x800(2048) 无 变化 

0 0 | 
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0x80000000(-2G) 0 1 
OxFFFFFB32(-1230) 0 1 


4.4 ”CM3 中 一 些 表 卫 的 指令 
这 里 列 出 几 条 从 v6 和 v7 开始 才 支 持 的 最 新 指令 ， 


4.4.1 MRS 和 MSR 


虽然 名 字 与 以 前 的 ARM 相同 , 但 功能 变 了 。 这 两 条 指令 是 访问 特殊 功能 寄存 器 的 “专用 通道 ”一 一 
当然 必须 在 特权 级 下 使 用 ， 除 了 APSR 可 以 在 用 户 级 下 访问 外 。 


指令 语法 如 下 : 
MRS <Rn>, <SReg> ; 加 载 特殊 功能 寄存 器 的 值 到 Rn 
MSR <Sreg>, <Rn> ;存储 Rn 的 值 到 特殊 功能 军 存 器 


SReg 可 以 是 下 表 中 的 一 个 : 
表 4.31 MRS/MSR 可 以 使 用 的 特殊 功能 寄存 器 














符号 功能 

IPSR 当前 服务 中 晰 号 寄存 占 

EPSR 执行 状态 寄存 嚣 ( 读 回来 的 总 是 0)。 它 里 面 含 T 位 , 在 CM3 中 T 位 必须 是 4 所 以 在 更 改 EPSR 
时 要 格外 小 心 一 一 译注 。 

APSR 上 条 指令 结果 的 标志 

IEPSR IPSR+EPSR 

IAPSR IPSR+APSR 

EAPSR EPSR+APSR 

PSR xPSR = APSR+EPSR+IPSR 

MSP 主 堆栈 指针 

PSP 进入 堆栈 指针 

PRIMASK 第 规 寞 党 屏蔽 寄存 器 

BASEPRI 第 规 寞 党 的 优先 级 闵 值 琳 存 器 





BASEPRI_MAX 等同 BASEPRI， 但 是 施加 了 写 的 限制 : 狐 的 优先 级 比较 比 旧 的 高 (更 小 的 数 ) 
FAULTMASK ”fault 屏蔽 寄存 器 (除了 包含 PRIMASK 的 全 部 功能 外 ， 还 能 除 能 人 硬 fault) 





CONTROL 控制 寄存 器 (堆栈 选择 ， 特 权 等 级 设置 ) 
下 面 给 出 一 个 指定 PSP 进行 更 新 的 例子 : 
LDR RO, =0x20008000 
MSR PSP, RO 
BX LR ; 如 果 是 从 寞 弟 返 回 到 线程 状态 ， 则 使 用 狐 的 PSP 的 值 作为 栈 项 指针 





4.4.2 IF-THEN 


IF-THEN(IT) 指 令 围 起 一 个 块 ， 里 面 最 多 有 4 条 指令 ， 它 里 面 的 指令 可 以 条 件 执行 。 

IT 指令 已 经 带 了 一 个 “T” 因此 还 可 以 最 多 再 带 3 个 “T” 或 者 “E”。 并 有 财 T 和 E 的 顺序 没有 
要 求 。 其 中 T 对 应 条 件 成 立时 执行 的 语句 ，E 对 应 条 件 不 成 立时 执行 的 语句 。 在 If-Then 块 中 的 指令 
必须 加 上 条 件 后 级 ， 且 TT 对 应 的 指令 必须 使 用 和 IT 指令 中 相同 的 条 件 ，E 对 应 的 指令 必须 使 用 和 IT 

和 令 中 相反 的 条 件 。 
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IT 的 使 用 形式 总 结 如 下 : 


IT <cond> ; 围 起 1 条 指令 的 IF-THEN 块 
IT<x> <cond> ; 围 起 2 条 指令 的 IF-THEN 块 
IT<x><y> <cond> ; 围 起 3 条 指令 的 IF-THEN 块 
IT<x><y><z> <cond> ; 围 起 4 条 指令 的 IF-THEN 块 


其 中 <x>, <y>, <z> 的 取 值 可 以 是 “T” 或 者 “E” 而 <cond> 则 是 在 表 4.26 中 列 出 的 条 件 CAL 除 上 人 )。 
[译注 17]: IT 指令 使 能 了 指令 的 条 件 执 行 方式 ， 并 且 使 CM3 不 再 预 取 不 满足 条 件 的 
指令 。 又 因为 它 在 使 用 时 取代 了 条 件 转移 指令 ， 还 避免 了 在 执行 流转 移 时 ， 对 流水 线 的 
清洗 和 重新 指令 预 取 的 开销 ， 所 以 能 优化 C 结 构 中 的 微小 if 块 和 很 多 “?:” 运 算 符 
IT 指令 优化 C 代码 的 例子 如 下 面 伪 代 码 所 示 : 


if (RO==R1) 








R3 = R4 + R5; 
R33 二 R3 7 2> 


R3 = R6 + RT; 
R3 全 RR3 / 之 ， 


可 以 写作 : 
CMP RO Rl ; 比较 RO 和 R1 
ITTEE EQ ; 如 果 RO == R1l, Then-Then-Else-Else 
ADDEQ R3, R4, R5 ; 相等 时 加 法 


ASREOQO R3, R3, #1 ; 相等 时 算术 右 移 
ADD R3, R6, R7 ; 不 等 时 加 法 
ASR R3, R3, #1 ; 不 等 时 算术 右 移 






4.4.3 CBZ 和 CBNZ 
比较 并 条 件 跳 转 指令 专 为 循环 结构 的 优化 而 设 ， 它 只 能 做 前 向 跳 转 。 语 法 格式 为 ; 


CBZ <Rn>, <label> 

CBNZ <Rn>, <label> 

它们 的 跳 转 范围 较 军 ， 上 只 有 0-126。 
典型 范围 如 下 所 示 : 

while (RO!=0) 

{ 


Functionl(); 


CBZ RO, LoopExit 


BL Functionil 
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B Loop 
LOooPEX1It : 
与 其 它 的 比较 指令 不 同 ，CBZ/CBNZ 不 会 更 新 标志 位 。 





4.4.4 SDIV 和 UDIV 
突破 性 的 32 位 便 件 除法 指令 ， 如 下 所 示 : 


SDIV.W Rd, Rn, Rm 
UDIV.W Rd, Rn, Rm 


运算 络 东 是 Rd= Rn/Rm， 余 数 被 于 借 。 例 如 : 


LDR Py =300 
MOYV Rly #7 
UDIV.W R2, RO, 及 工 


则 R2= 300/7 =44 
为 了 捕捉 被 零 除 的 非法 操作 ， 你 可 以 在 NVIC 的 配置 控制 寄存 器 中 置 位 DIVBYZERO 位 。 这 样 ， 
如 果 出 现 了 被 零 除 的 情况 ， 将 会 引发 一 个 用 法 fault 异常 。 如 果 没 有 任何 措施 ，Rd 将 在 除数 为 零 时 








4.4.5 REV, REVH,REV16 以 及 REVSH 


REV 反 转 32 位 整数 中 的 字 市 序 ，REVH 则 以 半 池 为 单位 反 园 ， 且 只 反 转 低 半 字 。 语 法 格式 为 : 





REV Rd ， Rm 
REVH Rd, Rm 
REV16 Rd, Rm 
REVSH Rd, Rm 
例如 ， 记 R0=0x12345678， 在 执行 下 列 两 条 指定 后 : 
REV R1, RO 
REVH R2, RO 
REV16 R3, RO 


则 R1=0x78563412，R2=0x12347856，R3=0x34127856。 这 些 指 令 专 门 服务 于 小 端 模 式 和 大 端 模 
式 的 转换 ， 最 常用 于 网 络 应 用 程序 中 (网 络 字 节 序 是 大 端 ， 主 机 字 节 序 常 是 小 端 )。 

REVSH 在 REVH 的 基础 上 ， 还 把 转换 后 的 半 字 做 市 特写 扩展 。 例 如 ， 记 RO0=0x33448899, 则 

REVSH Ri1, RO 

执行 后 ，R1=0xFFFF9988 








4.4.6 RBIT 


RBIT 比 前 面 的 REV 之 流 更 精细 ， 它 是 按 位 反 转 的 ， 相 当 于 把 32 位 整数 的 二 进 制 表示 法 水 平 旋 
转 180 度 。 其 格式 为 : 

RBIT.W Rd, Rn 

这 个 指令 在 处 理 串 行 比 特 流 时 大 有 用 场 ， 而 且 儿 乎 人 到 了 没 它 不 行 的 地 步 (不信 可 以 去 写 段 程序 
完成 它 的 功能 ， 看 看 是 来 倒 去 的 能 不 能 把 你 “ 转 军 汪 。 

例如 ， 记 R1=0xB4E10C23 (二进制 数值 为 10110100,1110,0001,0000,1100,0010,0011 )， 

RBIT.W RO, 民工 

















77 


Cortex-M3 权威 指南 第 4 章 


执行 后 ， 则 RO=0xCc430872D 〈 二 进 制 数 值 为 1100,0100,0011,0000,1000,0111,0010,1101) 
这 条 指令 单独 使 用 时 看 不 出 什么 作用 ， 但 是 与 其 它 指令 组 合 使 用 时 往往 有 特效 ， 高 级 技巧 凋 用 


到 它 。 





4.4.7 SXTB, SXTH, UXTB, UXTH 





这 4 个 指令 是 为 了 体贴 C 语 言 的 强制 数据 类 型 转换 而 设 的 , 把 数据 光度 转换 成 处 理 桌 豆 欢 的 32 
位 长 度 〈 处 理 喜 字 长 是 多 少 ， 如 喜 欢 多 长 的 整数 ， 其 操作 效率 和 存储 效率 都 最 局 )。 它 们 的 语法 如 
下 : 


SXTB Rd, Rn 
SXTH Rd, Rn 
SXTB Rd, Rn 
UXTH Rd, Rn 





对 于 SXTB/SXTH， 数 据 和 之 符号 位 扩展 成 32 位 整数 。 对 于 UXTB/UXTH， 高 位 清 零 。 例 如 ， 记 
RO=0x55aa8765, 则 


SXTB R1, RO ; R1=0x00000065 
SXTH R1, RO ; R1=0xf£ffff£f8765 
UXTB R1, RO ; R1=0x00000065 
UXTH Rl RO ; R1=0x00008765 


4.4.8 BFC/BFI, UBFX/SBFX 


这 些 是 CM3 提供 的 位 段 操 作 指 令 , 这 里 所 讲 的 位 段 与 C 语言 中 的 位 段 是 一 致 的 , 它们 与 系统 程 
友和 单 厂 机 程序 非常 对 口 。 

BFC〔 位 段 清 零 ) 指令 把 32 位 整数 中 任意 一 段 连续 的 2 进 制 位 s 清 0， 话 法 格式 为 : 

BFC.W Rd, #1lsb, #width 

其 中 ，lsb 为 位 段 的 末尾 ，width 则 指定 在 lsb 和 它 的 左边 (更 高 有 效 位 )， 共 有 多 少 个 位 参与 操 
I 





例如 ， 
LDR RO, =0x1234FFFF 
BEC RO，# 井 4， 霖 10 


执行 完 后 ，RO= 0x1234COOF 

译注 : 位 段 不 支持 首尾 拼接 。 例 如 ， BFC ”R0,#27, #9 将 产生 不 可 预料 的 结果 

BFl (位 段 插入 指令 )， 把 某 个 寄存 器 按 LSB 对 齐 的 数值 ， 找 由 到 另 一 个 寄存 器 的 某 个 位 段 中 ， 
其 格式 为 








BFI.W Rd, Rn, #1l1sb, #width 
例如 ， 

LDR RO, =0xl12345678 

LDR R1, =0xAABBCCDD 

BFI.W R1, RO, #8, #16 





则 执行 后 ，R1= 0xAA5678DD (总 是 从 Rn 的 最 低位 提取 ，#lsb 只 对 Rd 起 作用 一 一 译注 ) 
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UBFX/SBFX 都 是 位 段 提 取 指 令 ， 语 法 格式 为 : 





UBFX.W Rd, Rn, #1l1sb, #width 

SBFX.W Rd, Rn, #1l1sb, #width 

UBFX 从 Rn 中 取出 任 一 个 位 段 ， 执 行 零 扩 展 后 放 到 Rd 中 《请 比较 与 BFI 的 不 同 )。 例 如 : 
LDR RO, =0x5678ABCD 

UBFX.W R1, RO, #12,4#16 


则 RO=0x0000678A 

类 似 地 ，SBFX 也 抽取 任意 的 位 段 ， 但 是 以 带 符 号 的 方式 进行 扩展 。 例 如 : 
LDR RO, =0x5678ABCD 

SBFX.W Rs RO， 东 8 ， 划 4 

则 RO=OxFFFFFFFB 

上 述 例子 为 了 描述 方便 使 用 了 4 比特 对 齐 的 州 sb 和 #width， 但 事实 上 并 无 此 限制 一 一 译注 





4.4.9 LDRD/STRD 


CM3 在 一 定 程度 上 支持 64 位 整数 。 其 中 LDRD/STRD 就 是 为 64 位 整数 的 数据 传送 而 设 的 , 语法 
格式 为 : 








LDRD .W RIL，RH， [Rn，#+/-offset] {!}; 可 选 预 索引 的 64 位 整数 加 载 
LDRD .W RL, RH, [Rn] ,#+/-offset ; 后 索引 的 64 位 整数 加 载 
STRD .W RIL，RH， [Rn，#+/-offset] {!] ;可 选 预 索引 的 64 位 整数 存储 
STRD .W RL, RH, [Rn] ,#+/-offset ; 后 索引 的 64 位 整数 存储 


例如 ， 记 (0x1000)= 0x1234_5678_ABCD_EF00: 则 
LDR R2, =0xl1000 

LDRD .W RO, Rl1, [R2] 

执行 后 ， RO= 0xABCD_EF00， R1=0x1234 5678 


同 理 ， 我 们 也 可 以 使 用 STRD 来 存储 64 位 整数 。 在 上 面 的 例子 执行 完毕 后 ， 寿 执行 如 下 代码 : 


STRD . W Rl1, RO, [R2] 
执行 后 ， (0x1000)=0xABCD EF00 1234 5678， 从 而 实现 了 双 字 的 字 序 反 转 操作 。 





4.4.16 TBB,TBH 


高 级 语言 都 提供 了 “分 类 讨论 ” 式 探 制 结 构 ， 如 C 语言 的 switch，Basic 语言 的 Select Case。 通 
第 ,给 我 们 的 印象 是 比较 菲 后 的 case 执行 起 来 效率 比较 低 , 因为 要 一 个 一 个 地 合 。 有 了 TBB/TBH 后 ， 
则 改善 了 这 类 结构 的 执行 效率 (可 以 对 比 51 中 的 MOVC) 

TBB( 查 表 跳 转 字 节 范围 的 偏 移 量 ) 指令 和 TBH ( 查 表 跳 转 半 字 范围 的 偏 移 量 ) 指令 ， 分别 用 于 
从 一 个 字 节 数组 表 中 查找 转移 地 址 ， 和 从 半 字 数组 表 中 查找 转移 地 址 。TBH 的 转移 范围 已 经 足以 应 
付 任 何 臭 长 的 switch 结构 。 如 果 写 出 的 switch 连 TBH 都 搞 不 定 ， 只 能 说 那 人 有 严重 自虐 倾向 。 

因为 CM3 的 指令 至 少 是 按 半 字 对 齐 的 , 表 中 的 数值 都 是 在 左 移 一 位 后 才 作 为 前 问 跳 转 的 偏 移 量 
的 。 又 因为 PC 的 值 为 当前 地 址 +4， 故 TBB 的 跳 转 范围 可 达 255*2+4=514; TBH 的 跳 转 范 赎 更 可 禹 达 
65535*2+4=128KB+2。 请 注意 : Both TBB 和 TBH 都 只 能 作 前 向 跳 转 ， 也 就 是 说 偏 移 量 是 一 个 无 符号 
整数 。 
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TBB 的 语法 格式 为 : 


TBB.W [Rn, Rm] ; PC+= RN[RM]*2 
在 这 里 ，Rn 指 同 跳 转 表 有 的 基 址 ，Rm 则 给 出 表 中 元 素 的 下 标 。 图 4.5 指示 了 这 个 操作 


| 





程序 执行 


流程 






Rm=N 


TBB [PC, Rm] 


VAL 0[7:0] 
VAL 1[7:0] 







PC 
Rn= (PC + 4) 


VAL_N[7:0] 


Rn 二 Rm 
新 PC= (PC+4)+2xVAL NI7:0] 


图 4.5 ”TBB 功能 演示 

如 果 Rn 是 R15， 则 由 于 指令 流水 线 的 影响 ，Rn 的 值 将 是 PCt4。 通 常 很 少 有 人 会 手工 计算 表 中 
偶 移 量 ， 因 为 很 系 ， 而 且 程序 修改 后 要 重新 计算 ， 尤 其 是 当 路 源 文件 个 表 时 《由 连接 器 负责 分 配 地 
址 )。 所 以 这 种 指令 在 汇编 中 很 少 用 到 ， 通 常 是 C 编译 器 专用 的 ， 它 可 以 在 每 次 编译 时 重建 该 表 。 
不 过 ， 可 以 为 各 入 口 地 址 取 个 标号 ， 而 且 此 指令 还 有 其 它 的 使 用 方式 。 在 系统 程序 的 开发 中 ， 此 指 
令 可 以 提高 程序 的 运行 效率 。 为 了 提供 一 个 节能 高 效 的 操作 系统 或 者 基础 郴 数 库 ， 必 须 挖空心思 地 
使 用 各 种 奇异 的 技巧 ， 甚 至 在 极端 情况 下 ， 还 要 严重 违反 常规 程序 设计 的 基本 原则 。 

另外 还 要 注意 的 是 ， 不 同 的 汇编 右 可 能 会 要 求 不 同 的 语法 格式 。 在 ARM 汇编 右 〈armasm.exe ) 
中 ，TBB 跳 转 表 的 创建 方式 如 下 所 示 : 















































TBB.W [pc, r0] ; 执行 此 指令 时 ，Pc 的 值 正 好 等 于 branchtable 
branchtable 
DCB ((dest0 - branchtable)/2) ; 注意 : 因为 数值 是 8 位 的 ， 故 使 用 DCB 指示 学 
DCB ((destl1 - branchtable)/2) 
DCB ((dest2 - branchtable)/2) 
DCB ((dest3 - branchtable)/2) 
dest0 


..。;， Ir0 = 0 时 执行 
dest1 


...; ro0 = 1 时 执行 
dest2 

... ; Ir0 = 2 时 执行 
dest3 


. ;Ir0 = 3 时 执行 











TBH 的 操作 原理 与 TBB 相同 , 只 不 过 跳 转 表 中 的 每 个 元 又 都 是 16 位 的 。 故 而 下 标 为 Rm 的 元 素 
要 从 Rn+2*Rm 处 去 找 。 如 图 4.6 所 演示 : 
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流程 


Ei 


TBH [PC, Rm, LSL 
pC #1] 


Rn= (PC + 4) VAL 0[15:0] 
VAL 1[15:0] 


Rn+2xRm VAL_N[15:0] 


4.6 ”TBH 功能 演示 


新 PC= (PC+4)+2xVAL NI15:0] 


TBH 跳 转 表 的 创建 方式 与 TBB 的 类 似 ， 如 下 所 示 : 
TBH.W [pc， r0， LSL #1]  ; 执行 此 指令 时 ，PcC 的 值 正好 等 于 branchtable 
branchtable 








DCI ((dest0 - branchtable)/2) ; 注意 : 数值 是 16 位 的 ， 故 使 用 DcI 指示 子 
DCI ((destl1 - branchtable)/2) 
DCI ((dest2 - branchtable)/2) 
DCI ((dest3 - branchtable)/2) 
dest0 
...; I0 = 0 时 执行 
dest1 
...; Ir0 = 1 时 执行 
dest2 
... ;， r0 = 2 时 执行 
dest3 
r 下 二 3 时 执行 
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仔 储 器 系统 


存储 器 系统 的 功能 概览 
存储 器 映射 

存储 器 的 各 种 访问 属性 
缺 省 的 存储 器 访问 许可 
位 带 操作 

非 对 齐 数据 传送 
互 斥 访问 

端 模式 


5.1 人 存储 系统 功能 概 砚 


CM3 的 存储 器 系统 与 从 传统 ARM 架构 的 相 比 ， 已 丝 有 过 脱胎 换 骨 般 的 改革 了 : 

第 一 ， 它 的 存储 器 映射 是 预定 义 的 ， 并 且 还 规定 好 了 哪个 位 置 使 用 哪 条 总 线 。 

第 二 ， CM3 的 存储 器 系统 支持 所 谓 的 “位 带 ”(bit-band) 操作 。 通 过 它 ， 实 现 了 对 单一 比特 
的 原子 操作 。 位 带 操 作 仅 适 用 于 一 些 特殊 的 存储 器 区 域 中 ， 见 本 章 论 述 。 

第 三 ， CM3 的 存储 器 系统 支持 非 对 齐 访问 和 互 斥 访问 。 这 两 个 特性 是 直到 了 v7M 时 才 出 来 的 。 

最 后 ，CM3 的 存储 器 系统 支持 both 小 端 配置 和 大 端 配 置 。 


5.2 ” 仔 依 器 映射 


CM3 只 有 一 个 单一 固定 的 存储 器 映射 。 这 一 点 极 大 地 方便 了 软件 在 各 种 CM3 单片机 间 的 移植 。 
举 个 简单 的 例子 ， 各 款 CM3 单片机 的 NVIC 和 MPU 都 在 相同 的 位 置 布设 寄存 器 ， 使 得 它们 变 得 与 具 
体 器 件 无 关 。 尺 管 如 此 ，CM3 定 出 的 条 条 框框 是 粗 线条 的 ， 它 依然 允许 心 片 制造 商 灵 活 细 肛 地 分 配 
存储 器 空 间 ， 以 制造 出 各 上 其 特色 的 单片机 产品 。 

存储 空间 的 一 些 位 置 用 于 调试 组 件 等 私有 外 设 ， 这 个 地 址 段 被 称 为 “私有 外 设 区 ”。 私 有 外 设 
区 的 组 件 包 括 : 

@ 闪存 地 址 午 载 及 汤 点 单元 (FPB) 
数据 观察 点 单元 (DWT) 
仪 占 化 跟踪 宏 单 元 (ITM) 
岁入 式 跟踪 宏 单 元 (ETM) 
跟 踩 奖 口 接口 单元 (TPIU ) 
ROM 表 

在 后 续 讨 论调 试 特性 的 章节 中 ， 将 详细 讲述 这 些 组 件 。 

CM3 的 地 址 空间 是 46B， 程 序 可 以 在 代码 区 ， 内 部 SRAM 区 以 及 外 部 RAM 区 中 执行 。 但 是 因为 
昌 令 总 线 与 数据 总 线 是 分 开 的 ， 最 理想 的 是 把 程序 放 到 代码 区 ， 从 而 使 取 指 和 数据 访问 各 自 使 用 自 
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己 的 总 线 ， 并 行 不 悖 。 
让 我 们 先 看 一 看 这 46B 的 粗 线条 划分 : 


OxEOOFFFFF 0 
0xE00FF000 ROM 表 本 

0xE0042000 外 部 PPB 由 心 片 供应 商定 义 

donnoob OxE0100000 


0xE0040000 TR 外 部 私有 外 设 总 线 OxEOOFFFFF 


一 一 一 一、 0xE0040000 
0 0xE003FFFF 
内 部 私有 外 设 总 线 
0xE003FFFF 0xE0000000 
0xE000F000 保 贸 


OxDFFFFFFF 
0xE000E000 NVIC 
1 
OxE0003000 | 
rm HIM cocB 
0xE0002000 
oxE0001000| powr | 
oxE0000000 二 上 上 HTMHHHHHHHH OxA0000000 
0x9FFFFFFF 
片 外 RAM 1.0GB 
Ox43FFFFFFII TIT IIIII 
32MB_ 位 带 别 名 区 - [Tilg 


i me | 
0x40100000 | 片上 外 设 512MB 
0x40000000 4MB 位 市 区 0x40000000 
0x23FFFFFFITTTTTT pp Ox3FFFFFFF 
二 HH 加 
二 二 片上 SRAM 512MB 
- 
男 面 面 国 硬 有 Db、 
ox22000000 叶 TTTTTITTTIITTTITITIITITIITIIIT 0x20000000 


0x2<IFFFFFF 0x1FFFFFFF 
0x20100000 代码 512MB 





































































































| 


oxz20000000[MD ym 


0x00000000 


5.1 ”Cortex-M3 预定 义 的 存储 器 映射 


内 部 SRAM 区 的 大 小 是 512MB， 用 于 让 心 片 制造 障 连 接 片 上 的 SRAM， 这 个 区 通过 系统 总 线 来 访 
问 。 在 这 个 区 的 下 部 ， 有 一 个 1MB 的 区 间 ， 被 称 为 “位 带 区 ”该 位 带 区 还 有 一 个 对 应 的 、32MB 的 
“位 带 别 名 (alias) 区 ” 容纳 了 8M 个 “位 变量 ”( 对 比 8651 的 只 有 128 个 位 变量 )。 位 带 区 对 应 
的 是 最 低 的 1MB 地 址 范围 ， 而 位 帝 别 名 区 里 面 的 每 个 字 对 应 位 市 区 的 一 个 比特 。 位 市 操作 只 适用 于 
数据 访问 ， 不 适用 于 取 指 。 通 过 位 带 的 功能 ， 可 以 把 多 个 布尔 型 数据 打包 在 单一 的 字 中 ， 却 依然 可 
以 从 位 带 别 名 区 中 ， 像 访问 普通 内 存 一 样 地 使 用 它们 。 位 带 别 名 区 中 的 访问 操作 是 原子 的 ， 消 炙 了 
传统 的 “ 读 一 改 一 写 ” 三 步 曲 。 位 带 操 作 的 细节 待 会 还 要 讲 到 。 

地 址 衬 间 的 另 一 个 512MB 范围 由 厂 上 外 设 〈 的 寄存 器 〉 使用。 这 个 区 中 也 有 一 条 32MB 的 位 市 
别名 ， 以 便于 快捷 地 访问 外 设 寄存 器 ， 用 法 与 内 部 SRAM 区 中 的 位 带 相 同 。 例 如 ， 可 以 方便 地 访问 
各 种 控制 位 和 状态 位 。 要 注意 的 是 ， 外 设 区 内 不 允许 执行 指令 。 

还 有 两 个 1GB 的 范围 ， 分 别 用 于 连接 外 部 RAM 和 外 部 设备 ， 它 们 之 中 没有 位 带 。 两 者 的 区 别 在 
于 外 部 RAM 区 允许 执行 指令 ， 而 外 部 设备 区 则 不 允许 。 
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最 后 还 剩 下 6.5GB 的 隐秘 地 带 ，CM3 内 核 的 围 房 束 在 这 里 耐 ， 包括 了 系统 级 组 件 ， 内 部 私有 外 
设 总 线 s， 外 部 私有 外 设 总 线 s， 以 及 由 提供 者 定义 的 系统 外 设 。 
私有 外 设 总 线 有 两 条 : 
@ AHB 私有 外 设 总 线 ， 只 用 于 CM3 内 部 的 AHB 外 设 ， 它 们 是 : NVIC，FPB，DWT 和 ITM。 
@ APB 私有 外 设 总 线 ， 既 用 于 CM3 内 部 的 APB 设备 ， 也 用 于 外 部 设备 (这 里 的 “外 部 ”是 对 
内 核 而 言 )。CM3 允许 吉 件 制造 商 再 添加 一 些 刻 上 APB 外 设 到 APB 私有 总 线 上 ， 它 们 通过 
APB 接口 来 访问 。 
NVIC 所 处 的 区 域 叫做 “系统 控制 空间 (SCS)” 在 SCS 里 的 除了 NVIC 外 ， 还 有 SysTick、MPU 
以 及 代 人 码 调 试 控制 所 用 的 寄存 占 ， 如 图 5.2 所 示 : 





RE se _ EL。 系统 控制 空间 
0xE000 
OxFFFFFFFF 一 一 
OxE0040000 
OxE003FFFF 
OxEOOFFFFF 
OxE0000000 





OxE0000000 0xE000E000 


5.2 ”系统 控制 空间 (SCS) 


最 后 ， 未 用 的 提供 商 指 定 区 也 通过 系统 总 线 来 访问 ， 但 是 不 允许 在 其 中 执行 指令 。 

CM3 中 的 MPU 是 选 配 的 ， 由 已 厂 制造 商 决 定 是 耕 配 上 。 

上 述 的 存储 器 映射 只 是 个 粗 线 条 的 模板 ， 半 导体 /家 会 提供 更 展开 的 图 示 ， 来 表明 心 厂 中 厂 上 
外 设 的 具体 分 布 ，RAM 与 ROM 的 容量 和 位 置信 息 。 


5.3 ”和 存储 器 的 各 种 访问 属性 


CM3 在 定义 了 存储 器 映 役 之 外 ， 还 为 存储 器 的 访问 规定 了 4 种 属性 ， 分 别 是 : 

@ 可 厂 缕 冲 (Bufferable) 

@ 可否 绥 存 (Cacheable) 

@ 可 人 否 执 行 (Executable) 

@ 可否 共享 (Sharable) 

如 果 配 了 MPU， 则 可 以 通过 它 配 置 不 同 的 存储 区 ， 并 旦 和 宪 盖 缺 省 的 访问 属性 。CM3 片 内 没有 配 

备 缕 存 ， 也 没有 绥 存 控制 磊 ， 但 是 允许 在 外 部 添加 绥 存 。 通 常 ， 如 果 提 供 了 外 部 内 存 ， 心 片 制造 商 

还 要 附加 一 个 内 存 控制 器 ， 它 可 以 根据 可 人 否 绥 存 的 设置 ， 来 管理 对 片 内 和 户外 RAM 的 访问 操作 。 地 

址 空间 可 以 通过 男 一 种 方式 分 为 8 个 512MB 等 份 : 

1. 代码 区 (68x6666 6666- 8@x1lFFF_FFFF)。 该 区 是 可 以 执行 指令 的 ， 绥 存 必 性 为 WT(“ 写 通 ”， 
Write Through)， 即 不 可 以 绥 存 。 此 区 认 人 允许 布设 数据 存储 器 。 在 此 区 上 的 数据 操作 是 通过 
数据 总 线 接口 的 (估计 读数 据 使 用 D-Code， 写 数据 使 用 System)， 日 在 此 区 上 的 写 操作 是 绥 
冲 的 。 

2. SRAM 区 (6x2666 8668 - 6x3FFF_FFFF)。 此 区 用 于 片 内 SRAM， 写 操作 是 缓冲 的 ， 并 且 可 以 
选择 WB-WA(Write Back，Write Allocated) 绥 存 属性 。 此 区 亦 可 以 执行 指令 ， 以 允许 把 代 
公 找 贝 到 内 存 中 执行 一 一 常用 于 固件 升级 等 维护 工作 。 

3. 片上 外 设 区 (6x4666 866868 - 8@x5FFF FFFF)。 该 区 用 于 片上 外 设 ， 因 此 是 不 可 缓存 的 ， 也 不 
可 以 在 此 区 执行 指令 (这 也 称 为 eXecute Never，XN。ARM 的 参考 手册 大 量 使 用 此 术语 )。 

4. 外 部 RAM 区 的 前 半 段 (6x6668 6666 - 68x7FFF FFFF )。 该 区 可 用 于 布设 片上 RAM 或 片 外 RAM， 
可 缓存 〈 组 存 属性 为 NB-NWA)， 并 且 可 以 执行 指令 。 
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. 外 部 RAM 区 的 后 半 段 (6x8666 6668 - 9x9FFF FFFF)。 除 了 不 可 缓存 (NT) 外 ， 同 前 半 段 。 
6. 外 部 外 设 区 的 前 半 段 (6xA666 6668 - 89xBFFF FFFF)。 用 于 片 外 外 设 的 寄存 器 ， 也 用 于 多 核 
系统 中 的 共享 内 存 〈 需 要 严格 按 顺 序 操作 ， 即 不 可 缓冲 )。 该 区 也 是 个 不 可 执行 区 。 
. 外 部 外 设 区 的 后 半 段 (6xC866 6666 - 6xDFFF FFFF)。 目 前 与 前 半 段 的 功能 完全 一 致 。 
8. 系统 区 (6xE6866 6668 - 6xFFFF FFFF)。 此 区 是 私有 外 设 和 供应 商 指定 功能 区 。 此 区 不 可 执 
行 代 码 。 系 统 区 涉及 到 很 多 关键 部 位 ， 因 此 访问 都 是 严格 序列 化 的 〈 不 可 缓存 ， 不 可 缓冲 )。 
而 供应 商 指定 功能 区 则 是 可 以 缓存 和 缓冲 的 。 














需要 注意 的 是 ， 在 CM3 的 第 一 版 中 ， 代 码 区 的 存储 磺 属 性 是 被 使 件 连 接 成 可 缓存 可 缓冲 的 ， 无 
法 通过 MPU 来 更 改 。 


者 添加 
写 通 ， 写 回 ， 与 写 时 申请 
写 回 (Wtite Back): 写 入 的 数据 先 吉 留 在 缓存 中 ， 待 到 必要 时 再 落实 到 最 终 目 的 地 ， 这 也 
cache 的 最 基本 职能 ， 用 于 改善 数据 传送 的 效率 ， 减 少 对 访问 主 存储 器 的 访问 操作 。 


通 (Wtrite Through): 写 操 作 “ 穿 透 ， 中 途 的 缓存 ， 直 接 落 入 最 终 的 存储 器 目的 地 址 中 。 可 
， 写 通 操作 架空 了 cache, 但 它 使 写 操作 的 结果 立即 生效 。 这 常用 于 和 片上 外 设 或 其 它 处 理 器 
享 的 内 存 中 ， 如 显卡 的 显存 ， 片 上 外 设 寄 存 器 ， 以 及 双核 系统 中 的 共享 内 存 。 写 通 操作 和 C 中 
的 “volatile 可 以 配合 使 用 一 一 带 volatile 属性 的 变量 往往 放 到 写 通 型 地 址 区 间 中 。 
写 时 申请 (Write Allocate): 俺 也 不 太 清 楚 ~ 





5.4 ”存储 器 的 缺 省 访问 许可 


CM3 有 一 个 缺 省 的 存储 访问 许可 , 它 能 防止 使 用 户 代 人 码 访 问 系 统 控 制 存储 空间 , 保护 NVIC、MPU 
等 关键 部 件 。 缺 省 访问 许可 在 下 列 条 件 时 生效 : 

@ 没有 配备 MPU 

@ 配备 了 MPU， 但 是 MPU 被 除 能 

如 有 末 司 用 了 MPU， 则 MPU 可 以 在 地 址 空间 中 划 出 大 干 个 regions， 并 为 不 同 的 region 规定 不 
同 的 访问 许可 权限 。 

氧 省 的 存储 器 访问 许可 权限 如 表 5.1 所 不 
表 5.1 存储 器 的 缺 省 访问 许可 











外 部 外 设 无 限制 


TTM E666 66668 - E668 6FFF | 可 以 读 。 对 于 写 操作 ， 除 了 用 户 级 下 允许 时 
阻 上 访问， 访问 会 引发 一 个 总 线 fault 
FPB 阻止 访问 ， 访 问 会 引发 一 个 总 线 fault 
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E666_E666 - E668_EFFF | 阻止 访问 ， 访 问 会 引发 一 个 总 线 fault。 但 
有 个 例外 : 软件 触发 中 断案 存 器 可 以 被 编程 
为 允许 用 户 级 访问 。 
阻 上 访问 ， 访 问 会 引发 一 个 总 线 fault 
阻 上 访问， 访问 会 引发 一 个 总 线 fault 





阻止 访问 ， 访 问 会 引发 一 个 总 线 fault 
阻止 访问 ， 访 问 会 引发 一 个 总 线 fault 
阻止 访问 ， 访 问 会 引发 一 个 总 线 fault 
供应 商 指定 


当 一 个 用 户 级 访问 被 阻止 时 ， 会 立即 产生 一 个 总 线 fault。 











5.5 ”位 市 操作 


支持 了 位 带 操 作 后 ， 可 以 使 用 普通 的 加 载 / 存 储 指令 来 对 单一 的 比特 进行 读 写 。 在 CM3 中 ， 有 
两 个 区 中 实现 了 位 带 。 其 中 一 个 是 SRAM 区 的 最 低 1MB 范围 ， 第 二 个 则 是 片 内 外 设 区 的 最 低 1MB 范 
围 。 这 两 个 位 带 中 的 地 址 除了 可 以 像 普通 的 RAM 一 样 使 用 外 ， 它 们 还 都 有 自己 的 “位 带 别 名 区 ”， 
位 带 别 名 区 把 每 个 比特 膨胀 成 一 个 32 位 的 字 。 当 你 通过 位 带 别 名 区 访问 这 些 字 时 ， 就 可 以 达到 访 
问 原始 比特 的 目的 。 





Ox20000000 Ox22000080 


Bit 
31 24 16 8 0 
ooooFFFFC[TTTTTTTTTTITITTTITTTTTTTTTTTTTT 
cgttt :ID 
( 共 LMB ) 


0x2200002C 0x22000010 0x22000000 
位 带 别名 
NE 的 由 一 
5.3A 位 市 区 与 位 市 别名 区 的 膀 上 胀 基 系 图 A: 


下 图 从 另 一 个 侧面 演示 比特 的 膨胀 对 应 关系 
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位 带 别 名 区 ( 共 32MB ) 


Ox23FFFFFC 和 ox23FFFFF8 | Ox23FFFFF4 | 0x23FFFFF0 | 0x23FFFFEC | Ox23FFFFE8 | Ox23FFFFE4 ©| 0x23FFFFE0 


0x2200001C 有 Ox22000018 | Ox22000014 | Ox22000010 | 0x2200000C | 0x22000008 | Ox22000004 上 Ox22000000 


bu SRAM 位 带 区 ( 共 1MB ) 


1 6 5 4 3 2 0 6~5_ 4 3 2 0 7 6 5 4 3 2 0 7 6 5 4 32 


图 0x200FFFFF 国 - 图 图 Ox200FFFFE 加 怖 出 0x200FFFFD 下 古国 0x200FFFFC T 


7r 6 5 4 3 2 0 7 6 5 4 3 2 0 7 6 5 4 3 2 0 诊 7 6 5 4 3 2 


TITLE NT 


5.3B 位 市 区 与 位 市 别名 区 的 脱 胀 对 应 关系 图 B 


举例 : 欲 设置 地 址 ex2666_6666 中 的 比特 2， 则 使 用 位 带 操作 的 设置 过 程 如 下 图 所 示 : 


不 使 用 位 市 功能 使 用 位 带 功 能 
;去 读 取 0x2000 0000 
处 的 值 到 寄存 吕 中 一 处 的 值 到 内 部 缓冲 区 


置 位 寄存 器 的 bit2 写 1 到 0x2200 0008 ee 


位 置 bit2 后 ， 再 把 值 


把 寄存 器 的 值 写 回 


到 0x2000 0000 与 回 0x2000 0000 





5.4 写 数 据 到 位 市 别名 区 


对 应 的 汇编 代码 如 图 5.5 所 示 


Without Bit-Band With Bit-Band 
LDR R0 ,=0x20000000 ; Setup address LDR RO0O,=0x22000008 ; Setup address 
LDR R1, [RO] ; Read MOV Rl1， #1 ; Setup data 


ORR.W R1, #0x4 ; Modify bit STR  R1, [RO0] 
STR R1, [RO] ; Write back result 


5.5 位 市 操作 与 普通 操作 的 对 比 ， 在 汇编 程序 的 角度 上 


; Write 





位 带 读 操作 相对 简单 些 : 
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无 Bit-Band 有 Bit-Band 


Read 0x20000000 映射 成 单 次 从 0x20000000 


0 Read from 总 线 传输 读 出 数据 后 ， 再 把 
把 bit2 右 移 到 LSB bit2 提 取出 来 
再 掩 若 其 它 的 位 s 











5.6 ”从 位 市 别名 区 中 读 取 比 特 


无 位 带 有 位 带 
LDR RO ,=0x20000000 ; 建立 地 址 LDR R00,=0x22000008 ; 建立 地 址 
LDR Rl1, [RO] ; Read LDR Rl1, [RO] ; Read 


UBFX.W Rl1,R1, #2, #1 ; 提取 bit2 


图 5.7 ” 读 取 比特 时 传统 方法 与 位 带 方法 的 比较 


位 带 操作 的 概念 其 实 36 年 前 就 有 了 ， 那 还 是 8651 单片机 开创 的 先河 。 如 今 ，CM3 将 此 能 力 进 
化 ， 这 里 的 位 带 操 作 是 8851 位 寻 址 区 的 威力 极度 加 强 版 。 

CM3 使 用 如 下 术语 来 表示 位 带 存 储 的 相关 地 址 

@ 位 种 区 : 文 持 位 市 操作 的 地 址 区 

@ 位 之 别名 对 别名 地 址 的 访问 最 终 会 变换 成 对 位 市 区 的 访问 (注意 : 这 中 途 有 一 个 地 址 

英 射 过 程 ) 

在 位 带 区 中 ， 每 个 比特 都 映射 到 别名 地 址 区 的 一 个 字 一 一 这 是 个 只 有 LSB 才 有 效 的 字 。 当 一 个 
别名 地 址 被 访问 时 ， 会 先 把 该 地 址 变换 成 位 带 地 址 。 对 于 读 操作 ， 读 取 位 带 地 址 中 的 一 个 字 ， 再 把 
需要 的 位 右 移 到 LSB， 并 把 LSB 返回 。 对 于 与 操作 ， 把 需要 写 的 位 左 移 全 对 应 的 位 序号 处 ， 然 后 执 
行 一 个 原 于 只 “全 一 改 一 与 ”三 

文 持 位 市 操作 的 两 个 内 存 区 的 范围 是 : 

9x2666 6666-6x266F FFFF (SRAM 区 中 的 最 低 1MB ) 

9x4666 _ 6666-6x466F FFFF〈 片 上 外 设 区 中 的 最 低 1MB) 

对 于 SRAM 位 带 区 的 某 个 比特 ， 记 它 所 在 字 节 地 址 为 A, 位 序号 为 n(ex<=n<=7)， 则 该 比特 在 别 
名 区 的 地 址 为 : 
AliasAddr = Ox22000000+((A-0x20000000)*8+n)*4 =6x22000000+ (A-Gx29899069)*32 省 
Nn*4 
对 于 片上 外 设 位 带 区 的 某 个 比特 ， 记 和 它 所 在 字 节 的 地 址 为 A, 位 序号 为 n(ex=n<=7)， 则 该 比特 在 别 
名 区 的 地 址 为 : 
AliasAddr = Ox42000000+((A-0x40000000)*8+n)*4 =9x42009006+ (A-Gx49899069)*32 二 
Nn*4 

上 式 中 ,“*#*4” 表 示 一 个 字 为 4 个 字 节 ,“*#8” 表 示 一 个 字 节 中 有 8 个 比特 。 

对 于 SRAM 内 存 区 ， 位 市 别名 的 重 映 射 如 表 5.2 所 示 : 
































表 5.2 SRAM 区 中 的 位 带 地 址 映射 


位 带 区 等 效 的 别名 地 址 
0x20000000.0 6x22666666.6 
0x20000000.1 6x22696964.9 


波 
tk 
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Ox20000000.2 9Xx22000008 .0 
Ox20000000.31 9X2200007CL.0 
Ox20000004.0 9Xx22000080 .0 
Ox20000004.1 9Xx22000084.0 
Ox20000004.2 9Xx22000088 .0 


Ox200FFFFC.31 Ox23FFFFFC.0O 


对 于 片上 外 设 ， 上 映射 天 系 如 下 表 所 示 : 
表 5.3 刻 上 外 设 区 中 的 位 和 市 地 址 映 冉 


位 带 区 等 效 的 别名 地 址 
Ox40000000.0 9Xx42000000 .0 
Ox40000000.1 Ox426060606064.0 
Ox40000000.2 9Xx42000008 .0 
0x40000000 .31 Ox4260060607C.0 
Ox40000004.0 Ox4260006006080.0 
Ox40000004.1 9Xx42000084.0 
Ox40000004.2 Ox420006006088.0 


Ox400FFFFC.31 Ox43FFFFFC.0O 


这 里 再 不 嫌 吵 嗪 地 举 一 个 例子 : 
1. 在 地 址 ex26666666 处 写 入 6x3355AACC 
2. 该 取 地 址 box22666668。 本 次 谈 访 问 将 旋 取 6x26666669， 并 提取 比特 2， 值 为 1。 
3. 往 地 址 ex22666668 处 写 86。 本 次 操作 将 被 映射 成 对 地 址 96x26866666 的 “ 讯 一 改 一 号 ”操作 
(原子 的 )， 把 比特 2 清 8。 
4. 现在 再 谈 取 6x26666669， 将 返回 6x3355AAC8 (bit[2] 已 清 零 )。 
位 带 别 名 区 的 字 只 有 LSB 有 和 意义。 另外， 在 访问 位 带 别 名 区 时 ， 不 管 使 用 哪 一 种 长 度 的 数据 传 
送 指令 ( 字 / 半 字 / 字 市 )， 都 把 地 址 对 齐 到 学 的 边界 上 上， 否则 会 产生 不 可 预料 的 结 


5.5.1 ”位 带 操 作 的 优越 性 


位 带 操 作 有 什么 优越 性 呢 ? 最 容易 想到 的 就 是 通过 GPIO 的 管 脚 来 单独 控制 每 蔓 LED 的 点 亮 与 
焊 灭 。 另 一 方面 ， 也 对 操作 串 行 接口 器 件 提供 了 很 大 的 方便 〈 和 典型 如 74HC165,CD4694)。 总 之 位 市 
操作 对 于 硬件 I/0 密集 型 的 底层 程序 最 有 用 处 了 。 对 于 大 范围 使 用 位 标志 的 系统 程序 来 说 ， 位 带 机 
制 也 是 一 大 福音 。 

CM3 中 还 有 一 个 称 为 “bit-bang” 的 概念 ， 它 通常 是 通过 “bit-band” 实 现 的 ， 但 是 它 俩 在 学 术 上 是 两 个 不 
同 的 概念 (不 过 本 书 中 除了 这 里 之 外 ， 束 再 也 没有 提 到 过 bit-bang 一 一 详 注 )。 

位 带 操 作 还 能 用 来 化 简 跳 转 的 判断 。 当 跳 转 依据 是 某 个 位 时 ， 以 前 必须 这 样 做 : 

令 ” 读 取 整 个 寄存 器 

令 ” 挫 敬 不 需要 的 位 

令 ”比较 并 跳 转 
现在 只 需 : 
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仿 ” 从 位 市 别名 区 读 取 状态 位 

令 ”比较 并 跳 转 
使 代码 更 便 洁 ， 这 只 是 位 带 操 作 优 越 性 的 初等 体现 ， 位 带 操 作 还 有 一 个 重要 的 好 处 是 在 多 任务 
中 ， 用 于 实现 共享 资源 在 任务 间 的 “ 互 锁 ” 访 问 。 多 任务 的 共享 资源 必须 满足 一 次 只 有 一 个 任务 访 
问 它 一 一 俱 即 所 请 的 “ 诛 子 操作 ”。 以 前 的 读 一 改 一 号 需要 3 条 指令 ， 导 致 这 中 间 留 有 两 个 能 家 中 


断 的 空当 。 于 是 可 能 会 出 现 如 下 图 所 示 的 紊乱 危 象 : 


Handler 湛 式 A 


线程 楼 式 
“ISR 置 位 bitl 
者 


i 数据 写 回 到 
PE 输出 请 口 











中 断 服务 例 程 





主 程序 
主 程序 清除 ISR 所 作 的 改动 已 丢失 ! 
bito 
读 取 输出 户口 玫 据 写 回 到 
的 但 到 寄存 器 输 峙 吝 口 
洽 册 诺 D8 仿 | m1 |ms|loo | 
Time 





5.8 ”共享 资源 在 色 乱 危 象 下 丢失 数据 演示 
同样 的 共 乱 危 象 可 以 出 现在 多 任务 的 执行 环境 中 。 其 实 ， 图 5.8 所 澳 示 的 情况 可 以 看 作 是 多 任 
务 的 一 个 特例 : 主 程序 是 一 个 任务 ，ISR 是 另 一 个 任务 ， 这 两 个 任务 并 发 执行 。 
通过 使 用 CM3 的 位 市 操作 ， 融 可 以 消灭 上 例 中 的 紊乱 危 稼 。CM3 把 这 个 “ 读 一 改 一 写 ” 做 成 一 
个 便 件 级 别 文 持 的 原子 操作 ， 不 能 航 中 断 ， 如 图 5 .9 所 演示 
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Handler 榜 式 一 
丝 程 模式 


这 过 位 带 别 全 
主 置 位 bitl 


中 断 服务 例 程 





主 程序 通过 位 蒂 别名 
来 更 清除 bit0 
互 鲍 的 谅 - 疏 - 写 互 锁 的 读 - 改 - 写 


WW 全 00 lol 0 


Time 


5.9 通过 位 珊 操 作 实 现 互 锁 访 问 ， 从 而 避免 紊乱 危 象 的 演示 











同样 道理 ， 多 任务 环境 中 的 紊乱 危 象 亦 可 以 通过 互 锁 访问 来 避免 
5.5.2 ”其它 数据 长 度 上 的 位 带 操作 


位 带 操 作 并 不 只 限于 以 字 为 单位 的 传送 。 亦 可 以 按 半 字 和 字 节 为 单位 传送 。 例 如 ， 可 以 使 用 
LDRB/STRB 来 以 字 节 为 长 度 单 位 去 访问 位 市 别名 区 ,， 同 理 可 用 于 LDRH/STRH。 但 是 不 管用 哪 一 个 对 
子 ， 都 必须 保证 目标 地 址 对 齐 到 字 的 边界 上 。 





























5.5.3 在 c 语言 中 使 用 位 带 操作 











不 焉 的 是 ， 在 C 编译 如 中 并 没有 生 接 文 持 位 市 操作 。 比 如 ，C 编 详 占 并 不 知道 同一 块 内 存 能 够 
使 用 不 同 的 地 址 来 访问 ， 也 不 知道 对 位 市 别名 区 的 访问 只 对 LSB 有 效 。 欲 在 C 中 使 用 位 市 操作 ， 最 
简单 的 做 法 就 是 #define 一 个 位 市 别名 区 的 地 址 。 例 如 : 

#define DEVICE_REGO ( (volatile unsigned long *) (0x40000000)) 


#define DEVICE REGO_BITO volatile unsigned long *) (0x42000000)) 


(人 
i#define DEVICE REGO BIT1 ((volatile unsigned long *) (Ox42000004)) 


*DEVICE REGO = OxAB; / /使 用 正常 地 址 访问 寄存 器 





*DEVICE_REG0 = *DEVICE_REG0 | 0x2; // 使 用 传统 方法 设置 pit1l 
*DEVICE_ REGO_BIT1 = 0x1; // 通过 位 市 别名 地 址 设置 pit1 

为 简化 位 市 操作 ， 也 可 以 定义 一 些 宏 。 比 如 ， 我 们 可 以 建立 一 个 把 “位 珊 地 址 十 位 序号 ”转换 
成 别名 地 址 的 宏 ， 再 建立 一 个 把 别名 地 址 转换 成 指针 类 型 的 宏 : 
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// 把 位 带 地 址 十 位 序号 ”转换 成 别名 地 址 的 安 
#define BITBAND (addr, bitnum) ((addr & OxFOO000000)+0x2000000+((addr & 
OxFFFFF) <<5)+ (bitnum<<2)) 


// 把 该 地 址 转换 成 一 个 指针 


#define MEM ADDR(addr) *((volatile unsigned long *) (adr)) 





在 此 基础 上 ， 我 们 残 可 以 如 下 改写 代位 : 


MEM_ ADDR (DEVICE_ REG0) = 0xAB; // 使 用 正常 地 址 访问 寄存 器 
MEM_ADDR (DEVICE_REG0)= MEM_ADDR (DEVICE_REG0) | 0x2; // 传 统 做 法 
MEM_ ADDR (BITBAND (DEVICE REGO0,1)) = 0x1， // 使 用 位 市 别名 地 址 


请 注意 : 当 使 用 位 市 功能 时 ， 要 访问 的 变量 必须 用 volatile 来 定义 。 因 为 5 编 详 项 并 不 知道 
同一 个 比特 可 以 有 两 个 地 址 。 所 以 就 要 通过 volatile， 使 得 编译 器 每 次 都 如 实地 把 新 数值 写 入 存 
储 左 ， 而 不 再 会 出 于 优化 的 考 感 ， 在 中 途 使 用 寄存 融 来 操作 数据 的 复 本 ， 下 到 最 后 才 把 复 本 与 回 一 
一 这 会 导致 按 不 同 的 方式 访问 同一 个 位 会 得 到 不 一 致 的 结束 《可 能 和 被 优化 到 不 同 的 寄存 大 来 保存 中 
间 结 未 一 一 详 注 ) 


译 者 添加 


在 GCC 和 RealView MDK ( 即 Keil) 开发 工具 中 ， 人 允许 定义 变量 时 手工 指定 其 地 址 。 如 : 


volatile unsigned Long bpVarAry [7] . attribute _(( at(ox20003014) ));} 























volatile unsigned long* const pbbaVar= (void*) (0x22000000+0x3014*8*4)， 
这 样 ， 就 在 6@x266863814 处 分 配 了 7 个 字 ， 共 得 到 了 32*7=224 个 比特 。 

在 long* 后 面 的 “const” 通 知 编译 器 ; 该 指针 不 能 再 被 修改 而 指向 其 它 地 址 。 
注意 : at() 中 的 地 址 必须 对 齐 到 4 字 节 边界 。 





再 使 用 这 些 比特 时 ， 可 以 通过 如 下 的 形式 : 

pbbavar[136]=1; // 置 位 第 136 号 比特 

不 过 这 有 个 局 限 : 编译 器 无 法 检查 是 否 下 标 越 界 。 那 为 什么 不 定义 成 
“bbaVarAry[224]” 的 数组 呢 ? 这 也 是 一 个 编译 器 的 局 限 : 它 不 知道 这 个 数组 其 实 就 是 
bbVarAry[7]， 从 而 在 计算 程序 对 内 存 的 占用 量 上 ， 会 平 白 无 故地 多 计 入 224*4 个 字 节 。 
对 于 指针 形式 的 定义 ， 可 以 使 用 宏 定义 ,为 每 个 需要 使 用 的 比特 取 一 个 字面 值 的 名 字 , 在 下 
标 中 只 使 用 字面 值 名 字 ， 不 再 写真 实 的 数字 ， 就 可 以 极 大 程度 地 避免 数组 越界 。 

请 注意 : 在 定义 这 “两 个 ”变量 时 , 前 面 加 上 了 “volatile”。 如果 不 再 使 用 bbVarAry 
来 访问 这 些 比特 ， 而 仅仅 使 用 位 带 别 名 的 形式 访问 时 ， 这 两 个 volatile 均 不 再 需要 。 



































5.6 《 非 对 齐 数 据 传 这 


CM3 文 持 在 单一 的 访问 中 使 用 非 〈 地 址 ) 对 齐 的 传送 ， 数 据 存 储 器 的 访问 无 需 对 齐 。 在 以 六 ， 
ARM 处 理 器 只 人 允许 对 齐 的 数据 传送 。 这 种 对 齐 是 说 : 以 字 为 单位 的 传送 ， 其 地 址 的 最 低 两 位 必须 是 
6; 以 半 字 为 单位 的 传送 ， 其 地 址 的 LSB 必须 是 98; 以 字 节 为 单位 的 传送 则 无 所 谓 对 不 对 齐 。 如 果 
使 用 ex1661,9x1662 或 gx1663 这 样 的 地 址 做 宇 传送 ， 在 以 前 的 ARM 处 理 右 中 则 会 触 友 一 个 数据 
流产 (Data abort) 异常 一 一 与 CM3 中 总 线 fault 异常 的 作用 相同 。 

那么 , 非 对 齐 访问 看 起 来 是 什么 样子 呢 ? 图 5.12-5.16 给 出 了 5 个 例子 。 对 于 字 的 传送 来 说 ， 
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任何 一 个 不 能 被 4 整除 的 地 址 都 是 非 对 齐 的 。 而 对 于 半 字 ， 任 何不 能 被 2 整除 的 地 址 (也 束 是 奇数 


地 址 ) 都 是 非 对 齐 的 : 


Byte Byte Byte Byte 
3 2 


1 0 
aodressN+4[ | | a 
AddressN [129 | ed | Fo | 


5.12 非 对 齐 传送 示例 1 





Byte Byte Byte Byte 


3 2 1 0 
address N+4[ | [Td 


AddressN [ls | Fo | | 


5.13 非 对 齐 传达 示例 2 


Byte Byte Byte Byte 


3 2 1 0 
| es16l | Ts 
a | | 


5.14 非 对 阶 传 送 示 例 3 


AddressN + 4 
Address N 





Byte Byte Byte Byte 
， 2 1 


0 
AddressN+4| | | | 
AddressN | lrsa| [| 


5.15 非 对 齐 传达 示例 4 


Byte Byte Byte Byte 


3 2 1 0 
AddressN+4 | | sg 
AddressN [LF | | 


5.16 非 对 齐 传送 示例 5 


在 CM3 中 ， 非 对 齐 的 数据 传送 只 发 生 在 第 规 的 数据 传送 指令 中 ， 如 LDR/LDRH/LDRSH。 其 它 指 





令 则 不 支持 ， 包 括 : 


@ 多 个 数据 的 加 载 /存储 (LDM/STM) 
@ 堆栈 操作 PUSH/POP 
@ 互 斤 访问 (LDREX/STREX) 。 如 采 非 对 齐 会 导致 一 个 用 法 fault 


@ 位 市 操作 。 因 为 只 有 LSB 有 效 ， 非 对 齐 的 访问 会 导致 不 可 预料 的 结果 。 














事实 上 ， 在 内 部 是 把 非 对 齐 的 访问 转换 成 厂 干 个 对 章 的 访问 的 ， 这 种 转换 动作 由 处 理 右 总 线 单 
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元 来 完成 。 这 个 转换 过 程 对 程序 员 是 透明 的 ， 因 此 写 程 序 时 不 必 操 心 。 但 是 ， 因 为 它 通过 若干 个 对 
齐 的 访问 来 实现 一 个 非 对 齐 的 访问 ， 会 需要 更 多 的 总 线 周期 。 事 实 上 ， 市 省 内 存 有 很 多 方法 ， 但 没 
有 一 个 是 通过 压缩 数据 的 地 址 ， 不 惜 破坏 对 齐 性 的 这 种 劳 门 左 道 。 因 此 ， 应 养 成 好 习惯 ， 总 是 保证 
地 址 对 齐 ， 这 也 是 让 程序 可 以 移植 到 其 它 ARM 芯片 上 的 必要 条 件 。 

为 此 ， 可 以 编程 NVIC， 使 之 监督 地 址 对 齐 。 当 发 现 非 对 章 访 问 时 触发 一 个 fault。 其 体 的 办 法 
是 设置 “配置 控制 寄存 器 ”中 的 UNALIGN_TRP 人 位。 这样， 在 整个 调试 期 间 束 可 以 保证 非 对 齐 访 问 
能 当场 被 发 现 。 

















5.7 互 斥 芒 占 


细心 的 读者 可 能 会 发 现 ，CM3 中 没有 类 似 “SNP” 的 指令 。 在 传统 的 ARM 处 理 器 中 ，SWP 指令 
是 实现 互 斥 体 所 必需 的 。 到 了 CM3， 由 所谓 的 互 斥 访问 取代 了 SWP 指令 ， 以 实现 更 加 老练 的 共享 资 
源 访 问 保护 机 制 。 

互 斥 体 在 多 任务 环境 中 使 用 ， 也 在 中 断 服 务 例 程 和 主 程序 之 间 使 用 ， 用 于 给 任务 申请 共享 资源 

(如 一 块 共 圣 内 存 )。 在 某 个 (排他 型 ) 共 至 资 源 个 一 个 任务 拥有 后 ， 和 直到 这 个 任务 释放 它 之 前 ， 
其 它 任务 是 不 得 再 访问 它 的 。 为 建立 一 个 互 斥 体 ， 需 要 定义 一 个 标 访 变量 ， 用 来 指示 其 对 应 的 共 孚 
资源 是 否 已 经 被 某 任务 拥有 。 当 另 一 个 任务 欲 取 得 此 共 孚 资源 时 ， 它 要 驳 检 栓 这 个 互 斥 体 ， 以 获知 
共 孚 资源 是 否 无 人 使 用 。 在 传统 的 ARM 处 理 右 中 ， 这 种 检查 操作 是 通过 SWP 指令 来 实现 的 。SWP 你 
证 互 帮 体 检查 是 原子 操作 的 ， 从 而 避免 了 一 个 共 圣 资源 则 时 被 两 个 任务 占有 “(这 是 共 乱 危 银 的 一 种 
第 见 表现 形式 )。 

在 狐 版 的 ARM 处 理 右 中 , 读 / 写 访问 往往 使 用 不 同 的 总 线 , 导致 SWP 无 法 再 保证 操作 的 原子 性 ， 
因为 只 有 在 同一 条 总 线 上 的 读 / 写 能 实现 一 个 互 锁 的 传送 。 因此, 互 锁 传送 必须 用 另外 的 机 制 实 现 ， 
这 就 引入 了 “ 互 斥 访问 ” 互 斥 访 问 的 理念 同 SWP 非常 相似 ， 不 同 点 在 于 : 在 互 斥 访问 操作 下 ， 人 允 
许 互 斥 体 所 在 的 地 址 被 其 它 总 线 master 访问 ， 也 人 允许 被 其 它 运 行 在 本 机 上 的 任务 访问 ， 但 是 CM3 
能 够 “ 驶 回 ” 有 可 能 导致 觉 态 条 件 的 互 斥 写 操 作 。 

互 斥 访问 分 为 加 载 和 存储 ， 相 应 的 指令 对 了 为 LDREX/STREX， LDREXH/STREXH， 
LDREXB/STREXB， 分 别 对 应 于 字 / 半 学 / 子 市 。 为 了 介绍 方便 ， 以 LDREX/STREX 为 例 讲述 它们 的 使 



























































用 方式 。 
LDREX/STREX 的 语法 格式 为 : 
LDREX Rxf, [Rn, #0offset] 
STREX Rd, Rxf, [Rn， #offset] 





(本 市 的 以 下 内 容 是 译 者 改编 的 ) 

LDREX 的 语法 同 LDR 相同 ， 这 里 不 再 袭 述 。 而 STREX 则 不 同 。STREX 指令 的 执行 是 可 以 被 “ 驱 
加” 的 。 当 处 理 右 同音 执行 STREX 时 ，Rxf 的 值 被 存储 到 (Rn+toffset) 处 ， 并 日 把 Rd 的 值 更 新 为 
8。 但 大 处 理 器 驶 回 了 STREX 的 执行 ， 则 不 会 发 生存 储 动 作 ， 并 且 把 Rd 的 值 更 新 为 1。 

其 实 ， 奥 妙 就 在 于 这 个 “ 驶 回 ” 的 规则 上 。 规 则 可 宽 可 严 ， 最 严格 的 规则 是 : 

当 遇 到 STREX 指令 时 , 仅 当 在 它 之 前 执行 过 LDREX 指令 , 且 在 最 近 的 一 条 LDREX 指令 执行 后 ， 
没有 执行 过 其 它 的 STR/STREX 指令 ， 才 允许 执行 本 条 STREX 指令 一 一 也 束 是 说 只 有 在 LDREX 执行 
后 ， 从 时 间 上 与 之 距离 最 近 的 一 条 STREX 才能 成 功 执行 。 

其 它 情 况 下 ， 驶 回 此 STREX。 包 括 : 

令 ”中 途 有 其 它 的 STR 指令 执行 
令 ”中 途 有 其 它 的 STREX 指令 执行 。 
这 种 最 严格 的 规则 也 是 最 容易 实现 的 规则 。 在 CM3 的 技术 参考 手册 中 ， 推 荐 实现 者 标记 出 一 段 
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有 限 的 地 址 ， 只 在 这 段 地 址 中 适用 互 斥 访问 的 规则 ， 而 不 要 对 所 有 4GB 都 限制 住 。 这 段 地 址 通常 是 
从 LDREX 指令 族 给 出 的 地 址 开始 , 长 度 在 16 学 节 人 至 4K 字 丰 泄 转 内。 但 心 上 请 制造 商 可 能 更 倾 问 严格 
的 规则 。 

在 使 用 互 斥 访问 时 ，LDREX/STREX 必须 成 对 使 用 。 

为 什么 这 种 有 条 件 的 驶 回 可 以 避免 亲 乱 危 象 呢 ? 让 我 们 举 个 简 捍 的 例子 来 演示 。 这 个 例子 由 主 
程序 和 一 个 中 断 服 务 例 程 组 成 。 主 程序 答 试 对 (R@) 目 增 两 次 ， 中 断 服 务 例 程 则 把 (R8@) .5 置 位 。 计 
(R6) 的 初始 值 为 8。 

MalinProgram 

; 第 一 次 互 斥 上 自 增 
LryLlnclst 

LDREX r2, [RO] 

ADD 2 

;执行 到 这 里 时 ， 处 理 器 接收 到 外 中 断 3 请 求 ， 于 是 转 到 其 中 断 服务 例 程 TSREx3 中 

STREX Rl1, R2, [RO] ; STREX 被 驶 回 ，R1=1，(R0)=0x20 
LrylLne2td 

; 第 二 次 互 斥 目 增 

LDREX r2, [RO] 

















ADD r2, #1 

STREX Ri1, R2, [RO] ; STREX 得 到 执行 ，R1=0， (R0)=0x21 
ISREx3 

; 处 理 器 已 经 自动 把 R0-R3，R12，LR，PC，PSR 压 入 栈 

LDR R2 ， [RO] 

ORR R2 ， #0x20 

STR 人 [RO] ;在 ISREx3 中 设置 了 (r0) 的 Bit2 

BX LR ; 返回 时 ， 处 理 器 会 自动 把 R0-R3, R12, LR,PC,PSR 弹出 堆栈 








上 例 中 ， 主 程序 在 即将 执行 第 一 条 STREX 时 ， 产 生 了 外 部 中 断 #3。 处 理 器 打 断 主 程序 的 执行 ， 
进入 其 服务 例 程 TSREx3， 它 对 (RO) 执 行 了 一 个 写 操作 (STR)， 因 此 在 ISRExt3 返回 后 ，STREX 不 
再 是 LDREX 执行 后 的 第 一 条 存储 指令 ， 故 而 被 驶 回 。 从 而 ISREX3 对 (RE) 的 改动 束 不 会 萤 到 破坏 。 
随后 主 程序 再 次 尝试 目 增 运算 ， 这 一 次 在 STREX 执行 前 没有 其 它 任何 形式 的 存储 指令 ， 所 有 STREX 
成 功 执 行 。 

如 果 主 程序 使 用 普通 的 STR 会 怎么 样 呢 ? 对 于 第 一 次 目 增 , 主 程序 的 R2=1, 于 是 执行 后 (R8)=1， 
结 采 ， 中 断 服 务 程 序 对 (R8) 的 改动 在 此 丢失 ! 
上 例 是 为 渤 示 方便 才 写 了 第 2 次 日 增 尝 试 。 实 际 情况 是 用 循环 实现 的 : 






































Trylinc 
LDREX r2, [RO] 
ADD | 
STREX Ri1, R2, [RO] 
CMP R1, #1 ;检查 STREX 是 否 被 驳回 
BEQ TryInc ; 如 末 发 现 STREX 侯 驶 回 ， 则 重 试 。 





LDREX/STREX 的 工作 原理 其 实 很 简单 。 仍 然 以 上 一 段 程序 为 例 ， 当 执行 了 LDREX 后 ， 处 理 器 
会 在 内 部 标记 出 一 段 地 址 。 原 则 上 ， 这 段 地 址 从 Re 开始 ， 范 围 由 芯片 制造 商定 义 。 技 术 手册 推荐 
的 范围 是 在 4 字 节 至 4KB 之 间 ， 但 是 很 多 粗 线条 的 实现 会 标记 整个 46B 的 地 址 。 在 标记 以 后 ， 对 于 
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第 一 个 执行 到 的 STR/STREX 指令 ， 只 要 其 存储 的 地 址 落 在 标记 范围 内 ， 就 会 清除 此 标记 (对 于 整个 
4GB 地 址 都 被 标记 的 情况 ， 则 任何 存储 指令 都 会 清除 此 标记 )。 如 果 先 后 执行 了 两 次 LDREX， 则 以 后 
一 个 LDREX 标记 的 地 址 为 准 。 

执行 STREX 时 , 会 先 检 查 有 没有 做 出 过 标记 , 如 果 有 , 还 要 检查 存储 地 址 是 否 落 在 标记 范围 内 。 
只 有 通过 了 这 两 个 关卡 ，STREX 才 会 执行 。 否 则 ， 束 驶 回 STREX。 











当 使 用 互 斥 访问 时 , 在 CM3 总 线 接口 上 的 内 部 写 缓冲 会 被 旁 路 ， 即 使 是 MpU 规定 此 区 是 可 以 组 
冲 的 也 不 行 。 这 保证 了 互 斥 体 的 更 新 总 能 在 第 一 时 间 内 完成 , 从 而 保证 数据 在 各 个 总 线 主机 (master) 
之 间 是 一 致 的 。so 系统 的 设计 师 如 果 设 计 多 核 系 统 ， 则 必须 保证 各 核 之 间 看 到 的 数据 也 是 一 致 的 。 




















译 者 添加 的 选读 材料 一 一 互 斥 访问 的 深入 研究 


互 斥 访 问 可 以 递归 使 用 ， 且 最 后 一 次 递归 的 LDREX/STREX 对 子 最 先 完 成 。 如 下 例 所 示 : 
LDREXTestRecursive 

ldr sp ; 递归 次 数 N， 是 一 个 预定 义 的 第 数 
LoopWrapper 

push | 

Ler roo, =0x20003000 

sub 3 #1 
Trylinc 

ldrex ril, [ro0] 

adqd Es #1 

ldr 1 =DOSTREXRCSV 

cmp ee #0 

bne LoopWrapper 
DOSTREXRCSV 

strex 

cmp 

Ded Trylinc 

BOP {0O=r2y Pec} 
车 执行 前 (0x20003000)=0， 则 执行 后 (0x20003000) 王 N， 且 有 函数 被 递归 调用 N 次 。 这 段 
代码 的 工作 流程 难以 用 文字 说 清 ， 一 定 要 用 模拟 器 跑 过 才 容 易 理 解 
本 例 只 是 为 了 抛砖引玉 。 在 实际 的 程序 中 ， 极 少 会 这 样 钻 牛 角 尖 地 直接 递归 。 但 是 在 
多 任务 环境 下 ， 底 层 的 函数 库 往 往 会 * 重 入 "， 这 也 和 递归 的 情形 很 相似 。 另 外 ， 当 读 
者 在 本 书后 面 看 到 “ 自 旋 锁 ， 的 解释 时 ， 说 不 定 也 会 回想 起 这 里 呢 | 





5.8 ” 端 模 式 


CM3 文 持 both 小 站 模式 和 大 痛 模 式 。 但 是 ， 单 片 机 其 它 部 分 的 设计 ， 包 括 总 线 的 连接 ， 内 存 
控制 右 以 及 外 设 的 性 质 等 ， 也 共同 决定 可 以 文 持 的 内 存 类 型 。 所 以 在 设计 软件 之 前 ， 一 定 要 先 在 单 
刻 机 的 数据 手册 上 会 清楚 可 以 使 用 的 端 。 在 绝 大 多 数 情况 下 ， 基 于 CM3 的 单片机 部 使 用 小 端 模 式 一 
一 为 了 避免 不 必要 的 有 麻烦， 在 这 里 推荐 读者 清一色 地 使 用 小 问 模 式 。 
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CM3 中 对 大 端 模 式 的 定义 还 与 ARM7 的 不 同 〔( 小 端的 定义 都 是 相同 的 )。 在 ARM7 中 ， 大 端的 方 
去 和 被 称 为 “ 字 不 变 大 喘 ”， 而 在 CM3 中 ， 使 用 的 是 “ 衬 节 不 变 大 靖 ”。 如 表 5.4 所 示 。 








表 5.4 CM3 的 子 市 不 变 大 端 ， 存储 邢 视 图 


地 址 ， 长 度 Bits 31-24 Bits 23-16 Bits 15-8 Bits 7-6 
6Xx1666， 字 D[7:6] D[15:8] D[23:16] D[31:24] 
9x1666， 半 字 ”DI[7:08] D[15:8] - - 
9x1662， 半 字 “DT7:6] D[15:8] 

ex1666, 字 节 DI[7:08] 

686x1661， 字 节 D[7:6] 

68x1692， 字 市 D[7:6] 

6Xx1663， 字 他 D[7:6] 





表 5.5 CM3 的 学 和 不 变 大 奖 : 在 AHB 上 的 数据 

地 址 ， 长 度 Bits 31-24 Bits 23-16 Bits 15-8 Bits 7-6 
6x1666， 字 D[7:6] D[15:8] D[23:16] D[31:24] 
6x1666， 半 字 DT7:6] D[15:8] 
9x1662， 半 字 “DT7:6] D[15:8] 

6x16606， 字 节 D[7:08] 
6@x1661， 字 节 DT[7:6] 

6x1692， 字 节 D[7:6] 

68x1663,， 字 节  D[7:0] 








请 注意 ， 在 AHB 总 线 上 的 BE-8 模式 下 ， 数 据 字 节 lane 的 传送 格式 是 与 小 端 模 式 一 致 的 。 
这 是 不 同 于 ARM7TDMI 的 行为 ， 它 在 大 端 模式 下 会 有 另 一 种 总 线 车 道 (lane) 安排， 如 表 5.6 


所 示 。 

表 5.6 ARM7 的 学 不 变 大 新 在 AHB 上 的 数据 
地 址 ， 长 度 Bits 31-24 Bits 23-16 Bits 15-8 Bits 7-6 
9x1666， 字 D[7:6] D[15:8] D[23:16] D[31:24] 
9x1666， 半 字 “DT7:6] D[15:8] - - 
9x1662， 半 字 “DT7:6] D[15:8] 
ex1666, 字 节 DT7:6] 
6x1661， 字 节 DT[7:6] 
6x1602， 字 节 D[7:08] 
6x1663， 字 节 DT7:6] 











在 CM3 中 ， 是 在 复位 时 确定 使 用 哪 种 端 模式 的 ， 且 运行 时 不 得 更 改 。 指 令 预 取 永 远 使 用 小 端 模 
式 ， 在 配置 控制 存储 空间 的 访问 也 永远 使 用 小 端 模式 (包括 NVIC，FPB 等 )。 另 外 ， 外 部 私有 总 线 
地 址 区 6xE6666666 至 86xE88FFFFF 也 永远 使 用 小 端 模式 。 

当 你 的 So 设计 不 文 持 大 端 模式 ， 却 有 一 些 外 设 包含 了 大 端 模式 时 ， 可 以 轻易 地 使 用 REV/REVH 
指令 来 完成 端 模式 的 转换 。 
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实现 Cortex-M3 的 全 景 概 狐 


流水 线 

评 细 的 框图 
Cortex-M3 的 总 线 接口 
Cortex-M3 的 其 它 接 口 
外 部 私有 总 线 
典型 的 连接 方式 

复位 信号 源 





[ 详 注 ]: 本 章 相 对 篇 幅 较 小 ， 但 该 息 本 章 需 要 一 些 处 理 需 体系 结构 基础 知识 ， 还 需要 一 些 ARM 处 理 器 特有 的 基础 知 
知 ， 且 只 有 设计 处 理 器 的 专业 人 员 才 必须 精通 。 如 条 这 方面 比较 薄弱 ， 只 需 知 道 有 哪些 组 件 ， 能 一 名 话 讲 出 它们 的 
功用 ， 文 持 的 调试 方式 ， 以 及 知道 有 哪儿 条 总 线 即 可 。 有 些 重 要 组 件 后 面 还 会 细 讲 。 如 NVIC， 融 入 了 后 和 面 各 革 中 。 
在 本 章 中 ， 可 能 与 调试 有 关 的 内 容 最 难 一 下 子 理解 。 但 不 用 担心 ， 在 第 15 革 和 第 16 革 中 ， 对 调试 相关 的 内 容 有 展 
开 论 述 。 说 实话 ， 本 章 也 是 翻 详 得 最 累 心 的 章 世 之 一 。 


6.1 流水线 


Cortex-M3 处 理 吉 使 用 一 个 3 级 流水 线 。 流 水 线 的 3 个 级 分 别 是 : 取 指 ， 解 码 和 执行 ， 如 图 


6.1 所 示 : 


6.1 Cortex-M3 的 三 级 流水 线 































Instruction N 






Instruction N 十 1 


Instruction N + 2 






Instruction N + 3 





有 些 人 会 提出 质疑 ， 认 为 其 实 是 4 级 ， 理 由 是 总 线 接口 在 访问 内 存 时 的 行为 。 但 是 这 一 级 是 在 
处 理 器 的 外 部 ， 故 而 处 理 器 自身 还 是 只 有 3 级 流水 线 。 

当 运 行 的 指令 大 多 数 都 是 16 位 时 ， 你 会 发 现 处 理 器 会 每 隔 一 个 周期 做 一 次 取 指 。 这 是 因为 CM3 
有 时 可 以 一 次 取出 两 条 指令 来 〈 一 次 能 取 32 位 )， 因 此 在 第 一 条 16 位 指令 取 来 时 ， 也 顺带 着 把 第 二 
条 16 位 指令 取 来 了 。 此 时 总 线 接口 束 可 以 先 拨 一 个 周期 再 取 指 。 或 者 如 果 绥 冲 区 是 满 的 ， 忆 线 接口 
干脆 束 空 下 来 了 。 有 些 指令 的 执行 需要 多 个 周期 ， 在 这 期 间 流 水 线 就 会 暂停 。 

当 执行 到 跳 转 指令 时 ， 需 要 清洗 流水 线 ， 处 理 器 会 不 得 不 从 跳 转 目的 地 重新 取 指 。 为 了 改善 这 
种 情况 ，CM3 文 持 一 定数 量 的 ARMV7M 狐 指令 ， 可 以 避免 很 多 微型 跳 转 ， 如 第 4 章 讲 到 的 IF-THEN 语 句 
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块 。 

由 于 流水 线 的 存在 ， 以 及 出 于 对 Thumb 代 但 兼容 的 考虑 ， 读 取 PC 时 ， 会 返回 当 六 指令 地 址 +4 的 
值 。 这 个 偶 移 量 总 是 4， 不 管 是 执行 16 位 指令 还 是 32 位 指令 ， 这 就 保证 了 在 Thumb 和 Thumb2 之 间 的 
一 致 性 。 











在 处 理 占 内 核 的 预 取 半 元 中 也 有 一 个 指令 缓冲 区 ， 它 允许 后 续 的 指令 在 执行 前 先 在 里 和 面 排队 ， 
也 能 在 执行 未 对 齐 的 32 位 指令 时 ， 避 免 流 水 线 “ 断 流 ” 不 过 该 缓冲 区 并 不 会 在 流水 线 中 添加 额外 
的 级 数 ， 因 此 不 会 使 跳 园 导致 的 性 能 下 降 〈penalty) 更 加 恶化 。 





人 存 傅 器 中 的 未 对 齐 的 
32 位 Thumb-2 指 令 








指令 缓冲 区 
(Inst C1) 


流水 线 级 数 


取 指 
(Inst C2 & D) 


6.2 ” 取 指 单元 使 用 组 ;中 区 对 32 位 指令 处 理 的 性 能 提升 
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6.2 ”详细 的 框图 


CM3 处 理 需 其 实 是 个 大 礼包 ， 里 面 除了 处 理 核心 外 ， 还 有 了 好 多 其 它 组 件 ， 以 用 于 系统 管理 和 
调试 文 持 。 


NMI 








| | 

| | a 

| 跟踪 
加 ETM ) TPIU 上 /输出 

| | 

| | 

| 








CM3Core 





连接 到 AHB 主 机 














AHB 互 连 
( 总 线 和 矩阵 ) 
连接 到 AHB 从 机 
内 部 私有 外 设 总 线 
(AHB) 
AHB-to- 
APB 、 
Bridge 内 部 私有 外 设 总 线 
和 (APB) 
I-Code D-Code 系统 总 线 APE 
指令 总 线 数据 局 线 私有 外 设 总 线 


6.3 Cortex-M3 处 理 器 系统 方 框图 


请 注意 : 虚线 框 住 的 MPU 和 ETM 是 可 选 组 件 ， 不 一 定 会 包含 在 每 一 个 CM3 的 MCU 中 。 好 多 新 
东 东 ， 图 中 一 时 看 不 请 了 ， 表 6.1 列 出 了 新 组 件 的 清单 。 


表 6.1 万 框图 中 的 缩写 及 其 定义 


含义 

柑 套 向 量 中 断 控制 器 

一 个 简易 的 周期 定时 器 ， 用 于 提供 时 基 ， 亦 被 操作 系统 所 使 用 

MPU | 存储 器 保护 音 元 (可 先 ) 

串 行 线 调试 端口 / 串 行 线 JTAG 调试 端口 。 通 过 串 行 线 调试 协议 或 者 是 传 
统 的 JTAG 协议 (专用 于 SNJ-DP)， 都 可 以 用 于 实现 与 调试 接口 的 连接 





AHB 访问 端口 ， 它 把 串 行 线 /SW] 接口 的 命令 转换 成 AHB 数据 传送 

棋 入 式 跟踪 宏 单元 可 选 组 件 )， 调 试用 。 用 于 处 理 指令 跟踪 

数据 观察 点 及 跟踪 单元 ， 调 试用 。 这 是 一 个 处 理 数据 观察 点 功能 的 模块 
仪器 化 跟踪 宏 单元 


跟踪 单元 的 接口 单元 。 所 有 跟踪 单元 发 出 的 调试 信息 都 要 先 送 给 它 ， 它 再 
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转 友 给 外 部 跟 躁 捕获 便 件 的 。 


FPB | Flash 地 址 重 载 及 断 点 单元 





一 个 小 的 查找 表 ， 其 中 存储 了 配置 信息 


可 见 ，Cortex-M3 处 理 豆 征 以 一 个 “处 理 融 子 系统 ”呈现 的 ， 其 CPU 内 核 本 里 与 NVIC 和 一 系 
列 调试 块 部 亲密 看 合 : 


CM3Core: Cortex-M3 处 理 器 的 中 央 处 理 核心 

骨 套 向 量 中 断 控制 器 NVIC: NVIC 是 一 个 在 CM3 中 内 建 的 中 断 控 制 器 。 中 断 的 具体 路 数 由 
心 记 三 商定 义 。NVIC 是 与 CPU 紧 耘 合 的 ， 它 还 包含 了 大 和 干 个 系统 控制 寄存 器 。 因 为 NVIC 
支持 中 断 能 套 ， 使 得 在 CM3 上 处 理 骨 套 中 断 时 清 碍 而 强大 。NVIC 还 采用 了 向 量 中 断 的 机 
制 。 在 中 汤 发 生 时 ， 它 会 上 自动 取出 对 应 的 服务 例 程 入 口 地 址 ， 并 且 直 接 调用 ， 无 第 软件 判 
定 中 断 源 ， 为 缩短 中 断 延 时 做 出 了 非常 重要 的 贡献 。 

SysTick 定时 器 : 系统 滴答 定时 器 是 一 个 非常 基本 的 倒计时 定时 器 ， 用 于 在 每 隔 一 定 的 时 
间 产 生 一 个 中 断 ， 即 使 是 系统 在 睡眠 模式 下 也 能 工作 。 它 使 得 0S 在 各 CM3 器 件 之 间 的 移 
植 中 不 必修 改 系 统 定时 器 的 代码 ， 移 植 工作 一 下 子 容易 多 了 。SysTick 定时 器 也 是 实现 在 
NVIC 内 部 的 。 

存储 占 保 护 单 元 : MPU 是 一 个 选 配 的 单元 ， 有 些 CM3 心 族 可 能 没有 配备 此 组 件 。 如 果 有 ， 
则 它 可 以 把 存储 器 分 成 一 些 regions， 并 分 别 予 以 你 护 。 例 如 ， 它 可 以 让 菏 些 regions 
在 用 户 级 下 变 成 只 读 ， 从 而 阻止 了 一 些 用 户 程 序 破坏 关键 数据 。 

BusMatrix: BusMatrix 是 CM3 内 部 总 线 系统 的 核心 。 它 是 一 个 AHB 互 连 的 网 络 , 通过 它 
可 以 让 数据 在 不 同 的 总 线 之 间 并 行 传送 一 一 只 要 两 个 总 线 主机 不 试图 访问 同一 块 内 存 区 
域 。 BusMatrix 还 提供 了 附加 的 数据 传送 管理 设施 ,包括 一 个 写 缓冲 以 及 一 个 按 位 操作 的 
逻辑 ( 位 带 (bit-band) )。 

AHB to APB Bridge: 它 是 一 个 总 线 桥 ， 用 于 把 看 干 个 APB 设备 连接 到 CM3 处 理 费 的 私 
有 外 设 总 线 上 【内 部 的 和 外 部 的 )。 这 些 APB 设备 常见 于 调试 组 件 。CM3 还 允许 芯片 厂商 
把 附加 的 APB 设备 挂 在 这 条 APB 总 线 上 ， 并 通过 APB 接 入 其 外 部 私有 外 设 总 线 。 



























































框图 中 其 它 的 组 件 都 用 于 调试 ， 通 种 不 会 在 应 用 程序 中 使 用 它们 ， 如 下 所 未 。 





SW-DP/SWJ-DP: 串 行 线 调 试 痕 口 SN-DP) /串口 线 JTAG 调试 应 口 “SNJ-DP) 都 与 AHB 
访问 端口 (AHB-AP) 协同 工作 ， 以 使 外 部 调试 器 可 以 发 起 AHB 上 的 数据 传送 ， 从 而 执行 调 
试 活 动 。 在 处 理 器 核心 的 内 部 没有 JTAG 扫描 链 ， 大 多 数 调 试 功能 都 是 通过 在 NVIC 控制 下 
的 AHB 访问 来 实现 的 。SW]J-DP 文 持 both 串 行 线 协 议和 JTAG 协议 ， 而 SN-DP 只 文 持 串 行 
线 协 议 。 

AHB-AP: AHB 访 问 端口 通过 少量 的 寄存 器 ， 提 供 了 对 CM3 所 有 存储 占 的 访问 机 能 。 该 功能 
块 由 SW-DP/SWJ-DP 通 过 一 个 通用 调试 接口 (DAPL™1) 来 控制 。 当 外 部 调试 器 需要 执行 动 
作 的 时 候 , 就 要 通过 SNW-DP/SW]J -DP 来 访问 AHB-AP, 再 由 AHB-AP 产 生 所 需 的 AHB 数 据 传送 。 
译注 : DAP 是 SW-DP/SWJ -DP 与 AHB-AP 之 间 的 总 线 接口 〈 详 见 第 15 章 ， 图 15.1) 

区 入 式 跟 踪 宏 单元 ETM: ETM 用 于 实现 实时 指令 跟踪 ， 但 它 是 一 个 选 配件 ， 所 以 不 是 所 有 
的 CM3 产品 都 具有 实时 指令 跟踪 能 力 。ETM 的 控制 寄存 器 是 映射 到 主 地 址 空间 上 的 ， 因 此 
调试 器 可 以 通过 DAP 来 控制 它 。 

数据 观察 点 及 跟踪 单元 DWT: 通过 DWT， 可 以 设置 数据 观察 点 。 当 一 个 数据 地 址 或 数据 的 
值 匹 配 了 观察 点 时 ， 吏 说 产生 了 一 次 匹配 命中 事件 。 匹 配 命中 事件 可 以 用 于 产生 一 个 观 守 
点 事件 ， 后 者 能 激活 调试 器 以 产生 数据 跟踪 信息 ， 或 者 让 ETM 联动 〈 以 跟踪 在 哪 条 指令 上 
发 生 了 匹配 命中 事件 一 一 译 者 注 )。 

仪器 化 跟踪 宏 单 元 ITM: ITM 有 多 种 用 法 。 软 件 可 以 控制 该 模块 直接 把 消 居 送 给 TPIU (类 
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似 printf 风格 的 调试 ); 还 可 以 让 DWT 匹配 命中 事件 通过 ITM 产生 数据 跟踪 包 ， 并 把 它 
输出 到 一 个 跟 踩 数据 流 中 。 

@ 跟踪 问 口 的 接口 单元 TPIU: TIPU 用 于 和 外 部 的 跟踪 人 硬件 (如 跟踪 端口 分 析 仪 交互 。 在 
CM3 的 内 部 ， 跟 踪 信 息 都 被 格式 化 成 “高 级 跟踪 总 线 (ATB) 包 ” TPIU 重新 格式 化 这 些 
数据 ， 从 而 让 外 部 设备 能 够 捕捉 到 它们 。 

@ FPB: FPB 提 供 flash 地 址 重 载 和 断 点 功能 。F1lash 地 址 重 载 是 指 : 当 CPU 访 问 某 条 指令 时 ， 
若 该 地 址 在 FPB 中 “ 挂 了 号 ” 则 将 把 该 地 址 重 映 射 到 另 一 个 地 址 ， 后 者 亦 在 编程 FPB 时 指 
出 。 结 果 ， 实 际 上 是 从 映射 过 的 地 址 处 取 指 《〈 通 常 ， 映 射 前 的 地 址 是 flash 中 的 地 址 ， 映 
射 后 的 地 址 是 SRAM 中 的 地 址 ， 所 以 才 是 ”Flash” 地 址 重 载 一 一 译 者 注 )。 上 此外， 匹配 的 地 
址 还 能 用 来 触发 断 点 事件 。Flash 地 址 重 载 功能 对 于 测试 工作 太 有 用 了 。 人 例如， 通过 使 用 
FPB 来 改变 程序 流程 , 就 可 以 给 那些 不 能 在 普通 情形 下 使 用 的 设备 添加 诊断 程序 代码 (such 


as adding diagnosis program code to a device that cannot be used in normal situations unless 








the FPB is used to change the program control.) 。 

@ ROM 表 : 它 只 是 一 个 简单 的 查找 表 。 其 实 更 像 一 个 “注册 表 ” 提供 了 存储 器 的 “注册 ” 信 
县 , 这 些 信息 指出 , 在 这 块 CM3 心 片 中 包括 了 哪些 系统 设备 和 调试 组 件 , 以 及 它们 的 位 置 。 
当 调试 系统 定位 各 调试 组 件 时 ， 所 需要 找 出 相关 寄存 器 在 存储 器 中 的 地 址 ， 这 些 信 息 由 此 
表 给 出 。 在 绝 大 多 数 情况 下 ， 因 为 CM3 有 固定 的 存储 器 上 映射， 所 以 各 组 件 都 对 号 入 座 
拥有 一 致 的 起 始 地 址 。 但 是 因为 有 些 组件 是 可 选 的， 还 有 些 组 件 是 可 以 由 制造 商 另 行 添 加 
的 ， 各 心 片 制造 商 可 能 竺 要 定制 他 们 心 片 的 调试 功能 。 以 后 CM3 心 片 会 有 越 来 越 多 的 品牌 
和 型 写 。 而 林子 大 了 什么 乌 者 有， 如 果 确 有 浅 商 “ 玩 为 类 ” 它 束 必须 在 ROM 表 中 给 出 这 
些 “ 为 类 ”的 信息 ， 这 样 调 试 软件 才能 判定 正确 的 存储 器 映射 ， 进 而 可 以 检测 可 用 的 调试 
组 件 是 何 种 类 型 。 























6.3 ”Cortex-M3 的 总 线 接口 





这 部 分 内 容 是 给 SoC 设计 师 看 的 。 如 末 你 不 是 他 们 , 是 不 能 直接 访问 这 里 讲 到 的 到 总 线 接口 的 。 
通 沼 情况 下 ， 心 片 厂商 部 会 钩 住 (hook up) 所 有 送 往 存 储 右 和 外 设 的 总 线 信和 号。 并且 在 少数 情 
万 








理 器 的 总 线 接口 是 基于 AHB-Lite 和 APB 协议 的 ， 它 们 的 规格 在 AMBA 规格 书 〈 第 4 版 ) 中 给 出 。 


6.3.1 I-Code 总 线 





I-Code 总 线 是 一 条 基于 AHB-Lite 总 线 协议 的 32 位 总 线 ， 负 责 在 0x0000_0000 一 Ox1FFF_FFFF 之 
间 的 取 指 操作 。 取 指 以 学 的 长 度 执 行 ， 即 使 是 对 于 16 位 指令 也 如 此 。 因 此 CPU 内 核 可 以 一 次 取出 
两 条 16 位 Thumb 指令 。 


6.3.2 D-Code 总 线 





D-Code 总 线 也 是 一 条 基于 AHB-Lite 总 线 协 议 的 32 位 总 线 ， 负 责 在 0x0000_0000 一 0x1FFF_FFFF 
之 间 的 数据 访问 操作 。 尽 管 CM3 文 持 非 对 齐 访问 ， 但 你 绝 不 会 在 该 总 线 上 看 到 任何 非 对 齐 的 地 址 ， 
这 是 因为 处 理 器 的 总 线 接口 会 把 非 对 齐 的 数据 传送 都 转换 成 对 章 的 数据 传送 。 因 此 ， 连 接 到 D-Code 
总 线 上 的 任何 设备 都 只 需 支 持 AHB-Lite 的 对 齐 访问 ， 不 需要 支持 非 对 齐 访问 。 


6.3.3 系统 总 线 


系统 总 线 也 是 一 条 基于 AHB-Lite 总 线 协 议 的 32 位 总 线 ， 负 责 在 0x2000_0000 - 0xDFFF_FFFF 和 
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0xE010_0000 - 0xFFFF_FFFF 之 间 的 所 有 数据 传送 ， 取 指 和 数据 访问 都 算 上 。 和 D-Code 总 线 一 样 ， 所 
有 的 数据 传送 都 是 对 齐 的 。 


6.3.4 ”外 部 私有 外 设 忌 线 


这 是 一 条 基于 APB 总 线 协 议 的 32 位 总 线 。 此 总 线 来 负责 0xE004 0000 - 0xE00F FFFF 之 间 的 私 
有 外 设 访问 。 但 是 ， 由 于 此 APB 存储 空间 的 一 部 分 已 经 被 TPIU、ETM 以 及 ROM 表 用 挥 了 ， 束 只 留 
下 了 0xE004 2000-EO0F_F000 这 个 区 间 用 于 配 接 附加 的 (私有 ) 外 设 。 


6.3.5 ”调试 访问 端口 总 线 


调试 访问 端口 总 线 接口 是 一 条 基于 “增强 型 APB 规格 ”的 32 位 总 线 , 它 专用 于 挂 接 调试 接口 ， 
例如 SWJ-DP 和 SW-DP。 

不 要 挪用 此 总 线 。 第 15 章 〈 调 试 架 构 ) 给 出 该 总 线 的 更 多 信息 ， 在 ARM 的 文档 《CoreSight 
Technology System Design Guide (Ref 3)》 中 也 有 更 详尽 的 论述 。 




















6.4 ”Cortex-M3 的 其 它 接口 








除了 总 线 接口 之 外 ，CM3 还 有 香干 个 用 于 其 它 目 的 的 接口 ， 这 些 接口 的 信号 都 不 大 可 能 会 引出 
到 引 脚 上 ， 而 只 用 于 连接 SoC 不 同 的 部 分 ， 或 者 干脆 就 没有 使 用 。 关 于 这 些 信号 的 详 述 ， 请 参阅 
《Cortex-M3 Technical Reference Manual(TRM)(Ref1)》。 表 6.2 中 给 出 了 它们 中 一 些 信 和 号 的 简短 小 结 。 
表 6.2 “杂项 接口 信号 




















信号 组 功能 

多 人 处理 机 通信 (TXEV，RXEV) 多 处 理 机 之 间 的 简单 任务 同步 信和 号 

休眠 信和 号 电源 管理 所 用 的 休眠 状态 

(SLEEPING, SLEEPDEEP) 

中 断 状态 信号 中 断 操作 的 状态 ， 用 于 ETM 操作 和 调试 

(ETMINTNUM, ETMINTSTATE, CURRPRI) 

复位 请 求 (SYSRESETREQ) 来 日 NVIC 的 复位 请 求 输出 

锁定 (Lockup) rs#al 和 停机 (Halted) 状 态 ”指示 人 处理 器 进入 了 锁定 状态 (由 在 人 硬 fault 和 

(LOCKUP, HALTED) NMI 服务 例 程 的 执行 错误 导致 )， 或 者 指示 处 理 
器 被 喊 停 〈 因 为 调试 动作 导致 ) 

端 输入 (ENDIAN) 在 内 核 复位 时 设置 端 模式 

ETM 接口 连接 到 和 藤 入 式 跟踪 宏 单 元 〈 用 于 指令 跟 踩 ) 

ITM 的 ATB 接口 高 级 跟踪 总 线 (ATB) 是 ARM CoreSight 调 试 


架构 下 的 一 个 总 线 协议 , 用 于 跟踪 数据 的 传送 。 
在 这 里 ， 该 接口 负责 把 来 自 ITM 的 跟踪 数据 输 
出 到 TPIU 





[译注 ] 第 12 章 讨 论 有 关 Lockup 的 更 多 内 容 


6.5 ”外 部 私有 有人 外 设 忆 线 


CM3 处 理 器 有 一 个 外 部 私有 外 设 总 线 (PPB) 接 口 。 外 部 PPB 接口 是 基于 高 级 外 设 总 线 (APB) 协 议 
构造 的 。 用 于 非 共 圣 的 系统 设备 ， 例 如 调试 组 件 。 为 了 支持 CoreSight 设备 ， 该 接口 又 包含 了 称 为 
“PADDR31” 的 信和 号， 给 出 传送 的 发 源 地 。 知 该 信号 为 0， 则 表示 是 运行 在 CM3 内 部 的 软件 产生 了 
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传送 操作 ; 石 为 1， 则 表示 是 调试 价 件 产生 了 传送 操作 。 有 了 这 个 信号 ， 外 设 束 可 以 有 选择 地 啊 应 ， 
比如 : 只 响应 调试 硬件。 也 可 以 通融 点 当 软 件 发 起 数据 传送 时 ， 限 制 一 些 功 能 。 

该 忆 线 是 专用 的 ， 不 服务 于 普通 的 外 设 ， 这 个 规矩 只 能 徘 蕊 片 设计 者 目 觉 如 守 。 如 果 设 计 者 把 
通用 的 外 设 连接 到 该 总 线 上 ， 用 户 在 使 用 怪 片 时 束 往 往 会 迪 到 各 种 砚 名 其 妙 的 问题 一 一 由 特权 访问 
常理 造成 。 例 如 ， 在 用 户 级 下 访问 这 些 设备 ， 或 者 在 使 用 MPU 时 把 这 些 设 备 从 其 它 的 存储 regions 
中 分 开 ， 虱 会 遇 到 问题 ， 势 必 影 啊 忆 万 的 销量 。 

外 部 PPB 不 文 持 非 对 齐 访问 。 因 为 该 总 线 的 宽度 是 32 位 并 且 是 基于 APB 的 ， 当 你 在 为 该 存储 
区 域 设计 外 设 时 ， 必 须 确保 所有 的 寄存 闫 地 址 都 是 投 字 对 齐 的 。 万 外 ， 在 编号 这 些 设备 的 驱动 程序 
时 ， 最 好 让 所 有 的 访问 都 使 用 池 的 长 度 。 最 后 ，PPB 访问 永远 是 小 并 的 。 


6.6 ”连接 方式 翌 板 


由 上 可 见 ，CM3 中 有 奋 干 个 总 线 接口 ， 初 学 者 很 容易 混淆 ， 也 不 太 容 易 弄 清楚 它们 是 怎样 与 其 它 设 
备 和 存储 旧 连 接 的 。 这 里 给 出 一 个 样板 的 连接 实例 ， 如 图 6.4 所 示 。 














































附加 的 调试 组 件 





Cortex-M3 
外 部 私有 外 设 总 线 


I-Code 总 线 D-Code 总 线 系统 总 线 


TT I 1 7 


AHB to 
静态 RAM er 设备 #1 设备 #2 APB 
桥 


6.4 ”Cortex-M3 总 线 连接 样板 范例 

因为 代码 存储 区 既 可 以 由 指令 指令 总 线 (-Code) 访 问 〈 当 从 此 区 取 指 时 ) ， 也 可 以 被 数据 总 线 
(D-Code) 访问 〈 当 在 此 区 访问 数据 时 ) ， 需 要 在 中 间 插 入 一 个 总 线 开 关 ， 称 为 “总 线 矩 阵 cg ” 
或 者 使 用 一 个 AHB 总 线 复 用 堪 。 如 果 使 用 了 总 线 窍 阵 ， 则 闪存 和 附加 的 SRAM 《如 果 有 的 话 ) 可 以 
被 both Il-Code 和 D-Code 访 问 。 总 线 矩 阵 可 以 在 ARM 的 AMBA 开 发 包 ADK (ADK，AMBA 组 件 和 示例 系统 
的 集合 ， 使 用 VHDL/Verilog 编 写 ) 中 提供 。 
[译注 」 : 这 里 所 讲 的 总 线 和 矩阵 不 是 CM3 内 部 的 总 线 和 矩阵 ， 它 们 是 两 码 事 。CM3 内 部 的 总 线 和 矩阵 是 专门 设计 的 ,不 
能 作为 一 个 通用 的 AHB 开关 来 使 用 。 

当 数 据 访问 和 取 指 同时 尝试 访问 同一 块 区域 时 ， 可 以 赋予 数据 访问 更 高 的 优先 级 以 提高 性 能 。 
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在 使 用 AHB 总 线 和 矩阵 把 取 指 和 数据 访问 分 开 后 , 如 果 指 令 总 线 和 数据 总 线 在 同一 时 刻 访 问 不 同 
的 存储 器 设备 (例如 ， 从 flash 中 取 指 的 同时 从 附加 的 SRAM 中 访问 数据 ) ， 则 两 者 可 以 并 行 不 悖 。 
但 若是 只 使 用 了 总 线 复 用 器 , 则 数据 传送 就 不 能 同时 发 生 了 , 然而 这 时 电路 尺寸 能 做 得 更 小 。 不 过 ， 
通常 的 CM3 单片机 都 使 用 系统 总 线 来 连接 SRAM。 而 且 主 SRAM 确实 应 该 使 用 系统 总 线 来 连接 。 只 
有 这 样 才能 落 到 SRAM 存储 器 的 地 址 区 ， 从 而 得 以 利用 CM3 的 位 带 操作 能 力 。 

有 些 脚 数 比 较 多 的 单片机 会 带 外 部 总 线 接口 (EMI) 。 这 种 情况 下 ， 需 要 一 个 外 部 存储 器 控制 
器 ， 因 为 AHB 不 接受 直接 把 片 外 存储 器 挂 在 它 上 面 ， 通常 外 部 存储 器 控制 器 也 连接 到 系统 总 线 上 。 
其 它 的 AHB 设 备 则 可 以 简单 地 连接 到 系统 总 线 上 ， 而 不 需要 额外 的 总 线 和 矩阵 。 

图 6.4 给 出 的 只 是 一 个 很 简单 的 典型 示范 ， 必 斤 设 计 师 也 可 以 选择 其 它 的 总 线 连接 方案 。 对 于 软 
件 /固件 的 开发 ， 不 需 了 解 这 么 多 细节 ， 只 需要 知道 详细 的 存储 需 映 射 束 够 了 。 

上 图 显示 出 的 功能 框 ， 像 总 线 矩 阵 、AHB-to-APB 总 线 桥 、 存 储 器 控制 器 、VoO 接 口 、 定 时 器 以 及 
UART 和 等， 都 可 以 从 ARM 和 其 它 IP 供 应 商 处 取得 。 不 同 的 CM3 单 片 机 其 片上 外 设 也 不 同 。 因 此 在 使 用 
时 ， 你 还 需要 参考 器 件 上 家 提供 的 参考 手册 。 














6.7 ”复位 信号 





基于 CM3 的 单片机 对 复位 电路 有 特定 的 要 求 ， 其 体内 容 在 《Cortex-M3 Technical Reference 
Manual(Ref1)》 中 给 出 ， 它 列 出 了 硅 干 个 可 以 使 用 的 复位 信号 。 不 过 ， 实 现成 单片机 后 ， 往 往 只 用 
到 了 1 全 2 个 。 人 至 余 其 它 的 ， 心 厂 厂 商会 在 心 片 中 布设 复位 信号 发 生 右 ， 由 它 在 内 部 产生 剩余 的 复位 
言 写 。 如 欲 获 取 细 和 ， 还 需要 参考 制造 商 提供 的 数据 手册 ， 以 理解 如 何 正 确 复位 其 必 上 请。 在 CM3 处 
理 器 的 水 平 上 ， 复 位 信号 由 表 6.3 列 出 。 


表 6.3 ”Cortex-M3 中 的 各 种 复位 信和 号 














系统 复位 只 影响 处 理 器 核心 、NVIC (与 调试 相关 的 除外 ) 以 及 MPU， 
(nSYSRESET) 不 复位 调试 系统 
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来 自 外 部 的 
复位 信号 


全 6.5 


SYSRESETn 
复位 信号 
发 生 器 PORESETn 
nTRST 


调试 接口 


可 选 的 调试 系统 


典型 的 Cortex-M3 芯 片 内 部 复位 信号 和 其 作用 范围 示意 图 


单片机 /SoC 
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寞 各 关 型 
优先 级 的 定义 

问 量 表 

中 断 输入 以 及 县 起 行为 
Fault 寞 第 

SVC 和 PendSsV 


7.1 ”异常 类 型 





Cortex-M3 在 内 核 水 平 上 搭载 了 一 个 异 毅 啊 应 系统 ， 文 持 为 数 众多 的 系统 开 币 和 外 部 中 断 。 其 








中 ， 编 号 为 1 一 15 的 对 应 系统 异常 ， 大 于 等 于 16 的 则 全 是 外 部 中 断 。 除 了 个 别 异 常 的 优先 级 被 定 
和 死 外 ， 其 它 弄 向 的 优先 级 都 是 可 编程 的 。 

















译注 : 所 有 能 打 断 正常 执行 流 的 事件 都 称 为 弄 香 。 在 本 书 中 ， 经 第 混合 使 用 术语 “中 断 ” 与 “ 异 钊 ?。 如 不 加 
说 明 ， 则 强调 的 都 是 它们 对 主 程序 所 体现 出 来 的 “中 断 ” 性 质 ， 与 我 们 以 前 学 单片机 时 所 讲 的 概念 是 相同 的 。 如 果 
非得 分 个 丁 一 卯 三 ， 则 中 断 与 异常 的 区 别 在 于 ， 那 246 个 中 断 对 CM3 核 来 说 都 是 “意外 突 发 事件 ”一 一 也 就 是 说 ， 
该 请 求 信号 来 日 CM3 内 核 的 外 面 ， 来 自 各 种 片上 外 设 和 外 扩 的 外 设 ， 对 CM3 来 说 是 “ 寞 步 ” 的 ; 而 异常 则 是 因 CM3 
内 核 的 活动 产生 的 一 一 在 执行 指令 或 访问 存储 器 时 产生 ， 因 此 对 CM3 来 说 是 “同步 ”的 。 

因为 芯片 设计 者 可 以 修改 CM3 的 硬件 描述 源 代码 ， 所 以 做 成 芯片 后 ， 支 持 的 中 断 源 数 日 常常 不 
到 246 个 ， 并 且 优 先 级 的 位 数 也 由 芯片 厂商 最 终 决 定 。 

类 型 编号 为 1 一 15 的 系统 异常 如 表 7.1 所 示 (注意 : 没有 编号 为 6 的 异常 )， 从 16 开始 的 外 部 
中 断 类 型 如 表 7.2 所 示 。 


表 7.1 系统 异常 清 


























编号 ”类 型 优先 级 简介 
N/A N/A 没有 异常 在 运行 
复位 -3 (最 高 ) ”复位 
NMI -2 不 可 屏蔽 中 断 ( 来 自 外 部 NMI 输 入 脚 ) 
3 硬 (hard)fault -1 所 有 被 除 能 的 fault ， 都 将 “上 访 ”(escalation) 成 硬 fault。 只 要 
因 FAULTMASK 没有 置 位 ， 硬 fault 服务 例 程 就 被 强制 执行 。Fault 
被 除 能 的 原因 包括 被 禁用 ， 或 者 补 PRIMASK/BASEPRI 被 掩 获 。 
若 FAULTMASK 也 置 位 ， 则 硬 fault 也 被 除 能 ， 此 时 彻底 “关中 ” 
MemManage ”可 编程 存储 器 管理 fault ，MPU 访问 违例 以 及 访问 非法 位 置 均 可 引发 。 
fault 企图 在 “ 非 执 行 区 ” 取 指 也 会 引发 此 fault 
5 总 线 fault 可 编程 从 总 线 系 统 收 到 了 错误 响应， 原因 可 以 是 预 取 流产 ( Abort ) 或 
| 数据 流产 ， 企 图 访问 协 处 理 器 也 会 引发 此 fault 


上 用 法 (usage 可 编程 。 ”由 于 程序 错误 导致 的 异常 。 通 常 是 使 用 了 一 条 无 效 指令 ， 或 者 是 


109 


Cortex-M3 权威 指 两 


泪 
J] 
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Faurt 非法 的 状态 转换 ， 例 如 尝试 切换 到 ARM 状态 

[者 保留 N/A N/A 

RO Svcall 可 编程 执行 系统 服务 调用 指令 ( SVC ) 引 友 的 异 妆 

和 调 坏 监视 器 。 ”可 编程 ”调试 监视 器 ( 断 点 ， 数 据 观察 点 ， 或 者 是 外 部 调试 请 求 ) 

下 天 用 保留 N/A N/A 

PendsV 可 编程 。 ” ”为 系统 设备 而 设 的 “可 悬挂 请求 ”( pendable request ) 
SysTick 可 编程 。 系统 滴答 定时 器 ( 也 就 是 周期 性 溢出 的 时 基 定 时 器 一 一 译注 ) 












表 7.2 外 部 中 断 清单 


NR 
ht 


a= 
5 RQ#239 | gg 





在 NVIC 的 中 断 控 制 及 状态 寄存 器 中 ， 有 一 个 VECTACTIVE 位 段 ; 另外 ， 还 有 一 个 特殊 功能 寄 
存 器 IPSR。 在 它们 二 者 的 里 面 ， 都 记录 了 当前 正 服务 的 异常 ， 给 出 了 它 的 编号 。 

请 注意 : 这 里 所 讲 的 中 断 号 ， 都 是 指 NVIC 所 使 用 的 中 断 号 。 男 一 方面 ， 心 厂 一 些 管 脚 的 名 学 
也 可 能 被 取 为 类 似 ”IRQ #” 的 名 字 ， 请 不 要 混 涌 这 两 者 , 它们 没有 必然 的 映射 关系 。 常见 的 情况 是 ， 
NVIC 中 编号 最 靠 前 的 儿 个 中 断 源 被 指定 到 片上 外 设 , 接 下 来 的 中 断 源 才 给 外 部 中 断 引 脚 使 用 ,因此 
还 是 要 参阅 芯片 的 数据 手册 来 弄 清楚 。 

如 果 一 个 发 生 的 异常 不 能 被 即刻 响应 ， 束 称 它 被 “县 起 ”(pending) 。 不 过 ， 少 数 fault 异常 
是 不 允许 被 基 起 的 。 一 个 异常 被 其 起 的 原因 ， 可 能 是 系统 当前 正在 执行 一 个 更 高 优先 级 异常 的 服务 
例 程 ， 或 者 因 相关 捧 蔽 位 的 设置 导致 该 异常 被 除 能 。 对 于 每 个 异常 源 ， 在 被 悬 起 的 情况 下 ， 都 会 有 
一 个 对 应 的 “其 起 状态 寄存 器 ”保存 其 异常 请 求 。 待 到 该 异常 能 够 响应 时 ， 执 行 其 服务 例 程 ， 这 与 
传统 的 ARM 是 完全 不 同 的 。 在 以 前 ， 是 由 产生 中 断 的 设备 保持 住 请 求 信 号 ; CM3 则 由 NVIC 的 其 起 
状态 寄存 器 来 解决 这 个 问题 。 于 是 ， 哪 怕 设 备 在 后 来 已 经 释放 了 请 求 信号 ， 和 曾经 的 中 断 请 求 也 不 会 
音 失 。 


7.2 “优先 级 的 定义 


在 CM3 中 ， 优 先 级 对 于 异 冲 来 说 很 关键 的 ， 它 会 决定 一 个 弄 各 是 售 能 衫 掩 巩 ， 以 及 在 未 掩 贡 的 
情况 下 何 时 可 以 啊 应 。 优 先 级 的 数值 越 小 ， 则 优先 级 越 咒 。CM3 文 持 中 断 玩 套 ， 使 得 高 优先 级 弄 御 
会 抢占 (preempt ) 低 优先 级 异 第 。 有 3 个 系统 寞 妾 : 复位 ，NMI 以 及 使 fault， 它 们 有 国定 的 优先 
级 ， 并 且 它 们 的 优先 级 号 古 负 数 ， 从 而 融 于 所 有 其 它 弄 第 。 所 有 其 它 异常 的 优先 级 则 者 是 可 编程 的 
(但 不 能 被 编程 为 负数 一 一 详 者 注 )。 

原则 上 ,CM3 支持 3 个 固定 的 高 优先 级 和 多 达 256 级 的 可 编程 优先 级 , 并且 文 持 128 组 全 占 (128 
的 来 历 请 见 下 文 分 解 一 一 译注 )。 但 是 ， 绝 大 多 数 CM3 忆 万 都 会 精 傈 设计 ， 以 致 实际 上 文 持 的 优先 
级 数 会 更 少 ， 如 8 级 ，16 级 ，32 级 等 。 它 们 在 设计 时 会 裁 反 表达 优先 级 的 几 个 低 背 有 效 位 ， 以 减 
少 优先 级 的 级 数 《〈 可 见 ， 不 坨 使 用 多 少 位 来 表达 优先 级 ， 都 是 以 MSB 对 齐 的 一 一 详 者 注 )。 

举例 来 说， 如 果 只 使 用 了 3 个 位 来 表达 优先 级 ， 则 优先 级 配置 寄存 此 的 结构 会 如 图 7.1 所 未 : 
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Bl 


用 于 表达 优先 级 没有 实现 ， 读 回 零 








7.1 ”使 用 3 个 位 来 表达 优先 级 的 情况 





在 图 中 ，[4:8] 没 有 被 实现 ， 所 以 读 它 们 总 是 返回 零 ， 写 它们 则 忽略 写 入 的 值 。 因 此 ， 对 于 3 
个 位 的 情况 ， 我 们 能 够 使 用 的 8 个 优先 级 为 : 9x68 〈 最 高 )，6x26，69x486，6x69，6Xx886，68xA6， 
9XxC6 以 及 8XxE6。 

如 果 使 用 更 多 的 位 来 表达 优先 级 ， 则 可 以 使 用 的 值 也 更 多 ， 同 时 需要 的 门 也 更 多 一 一 带 来 更 多 
的 成 本 和 功 耗 。CM3 允许 的 最 少 使 用 位 数 为 3 个 位 ， 亦 即 至 少 要 支持 8 级 优先 级 。 

下 图 给 出 使 用 3 个 位 表达 优先 级 vs .使 用 4 个 位 表达 优先 级 的 图 景 : 














加 使 用 3 个 位 来 使 用 4 个 位 来 
最 局 优先 级 表达 优先 级 表达 优先 级 
二 二 复位 -一 < 一 一 3 —X— 一 3 
-2 | NMI | —X— 一 2 一 关 一 -2 
一 1 —X— 一 1 —X— 一 1 
0 于 了 0 0 
一 兴 一 0x10 
0x20 一 兴 一 0x20 —X— 0x20 
—X— 0x30 
Ox40 —X— 0x40 一 兴 一 0x40 
一 兴 一 0x50 
0x60 优先 级 一 兴 一 0x60 一 兴 一 0x60 
可 编程 —X— 0x70 
0x80 的 异常 —X— 0x80 —X— 0x80 
—X— 0x90 
OxAO0 一 兴 一 0xA0 一 兴 一 0xA0 
一 2 一 OOXBOD 
0xC0 一 兴 一 0xC0 —X— 0xC0 
一 兴 一 0xD0 
OxE0 一 兴 一 OxE0 —X— 0xE0 
—X— 0xF0 
OxFF 
最 低 优先 级 


7.3 ”3 位 表达 的 优先 级 vs. 4 位 表达 的 优先 级 


通过 让 优先 级 以 MSB 对 齐 ， 可 以 简化 程序 的 路 器 件 移 植 。 比 如 ， 如 条 一 个 程序 早先 在 文 持 4 位 
优先 级 的 占 件 上 运行 , 在 移植 到 只 文 持 3 位 优先 级 的 右 件 后 , 其 功能 不 受 影响 。 但 硬是 对 齐 到 LSB， 
则 会 使 MSB 丢失 ， 导 致 数值 大 于 7 的 低 优 先 级 一 下 子 升 蜗 了 ， 甚 伴 会 发 生 “ 优 先 级 反 转 ” 使 它 局 
于 小 于 等 于 7 的 优先 级 。 如 ，8 号 优先 级 因为 损失 了 MSB， 现 在 反而 变 成 6 号 了 ; 而 15 写 优 先 级 则 
变 成 7 号 优先 级 ， 它 则 不 会 影响 6-6 号 优先 级 ， 使 得 这 个 问题 更 隐蔽 。 
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那么 当 使 用 了 3 位、5 位 及 8 位 来 表达 优先 级 时 ， 各 是 什么 情况 呢 ? 如 表 7.3 所 示 : 


7.3 3 位 、 5 EO 8 A WE Li 
EET FE EE aa 
医 区 攻 





抢占 优先 级 与 子 优先 级 


有 钻 劲 儿 的 读者 可 能 一 直 在 琢磨 ， 明明 支持 256 个 优先 级 ， 为 啥 只 有 128 个 抢占 级 ， 剩 下 一 半 
哪儿 去 了 ? 原来 ， 为 了 使 抢占 机 能 变 得 更 可 控 ，CM3 还 把 256 级 优先 级 按 位 分 成 高 低 两 段 ， 分 别称 
为 抢占 优先 级 和 子 优先 级 ， 如 下 所 述 。 

NVIC 中 有 一 个 盏 存 右 是 “应 用 大 夺 中 断 及 复位 控制 寄 仔 右 ” (内 容 见 表 7.5)， 它 里 面 有 一 个 位 
段 名 为 “优先 级 组 ”。 该 位 段 的 值 对 每 一 个 优先 级 可 配置 的 异常 都 有 影响 一 一 把 其 优先 级 分 为 2 个 
位 段 : MSB 所 在 的 位 段 〈 左 边 的 ) 对 应 抢占 优先 级 ， 而 LSB 所 在 的 位 段 〈 右 边 的 ) 对 应 子 优先 级 ， 
如 表 7 一 4 所 示 。 


表 7.4 ”抢占 优先 级 和 子 优先 级 的 表达 ， 位 数 与 分 组 位 置 的 关系 


a rp eq 
ab 
3 rp bb 
2 po 
5 rp sq 

7 


表 /7.5 ”应 用 程序 中 断 及 复位 控制 寄存 器 (AIRCR) ( 地 址 : 0xE000_ED00 ) 








15 ENDIANESS 指示 端 设置 。1= 二 大 端 (BE8)，98 二 小 端 。 此 
值 是 在 复位 时 确定 的 ， 不 能 更 改 。 


2 。 | SYSRESETREQ |W | -| 请求 世 片 控制 多 加 产生 一 次 复位 
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1 VECTCLRACTIVE W 清 零 所 有 异常 的 活动 状态 信息 。 通常 只 在 调 
试 时 用 ， 或 者 在 0S 从 错误 中 恢复 时 用 。 
Ee el 


复位 CM3 处 理 器 内 核 (调试 逻辑 除外 )， 但 
是 此 复位 不 影响 芯片 上 在 内 核 以 外 的 电路 

译注 :抢占 优先 级 有 时 亦 称 为 “组 优先 级 ”， 或 者 “ 主 优先 级 ”。 

抢占 优先 级 决定 了 抢占 行为 : 当 系 统 正在 啊 应 某 异 常 L 时, 如 果 来 了 抢占 优先 级 更 蜗 的 异常 H， 
则 H 可 以 抢占 上。 子 优先 级 则 处 理 “ 内 务 ”， 当 抢占 优先 级 相同 的 寞 党 有 不 止 一 个 晤 起 时 ， 就 最 先 啊 
应 子 优 先 级 最 局 的 异常 。 

这 种 优先 级 分 组 做 出 了 如 下 规定 : 子 优先 级 至 少 是 1 个 位 。 因 此 抢占 优先 级 最 多 是 7 个 位 ， 这 
就 造成 了 最 多 只 有 128 级 抢占 的 现象 。 

但 是 CM3 允许 从 比特 7 处 分 组 ， 此 时 所 有 的 位 都 表达 子 优先 级 ， 没 有 任何 位 表达 抢占 优先 级 ， 
因而 所 有 优先 级 可 编程 的 异常 之 同 束 不 会 友 生 抢占 一 一 相当 于 在 它们 之 中 除 能 了 CM3 的 中 断 租 僚机 
制 。 当 然 还 有 凌驾 于 法 律 之 上 的 三 位 老大 : 复位 ，NMI 和 人 硬 fault。 它 们 无 论 何 时 出 现 ， 都 立即 无 
条 件 抢占 所 有 优先 级 可 编程 的 “平民 异常 ”。 

在 计算 抢占 优先 级 和 子 优先 级 的 有 效 位 数 时 ， 必 须 先 求 出 下 列 值 : 

图 ” 心 厂 实际 使 用 了 多 少 位 来 表达 优先 级 

加 ”优先 级 组 是 如 何 划 分 的 。 

举 个 例子 ， 如 果 只 使 用 3 个 位 来 表达 优先 级 〈[7:5])， 并 且 优先 级 组 的 值 是 5〈 从 比特 5 处 分 
组 )， 则 得 到 4 级 抢占 优先 级 ， 且 在 每 个 抢占 优先 级 的 内 部 有 2 个 子 优 先 级 ， 如 图 7.4 所 示 。 












































cos 


图 7.4 ”3 位 优先 级 ， 从 比特 5 处 分 组 时 ， 优 先 级 位 段 的 划分 





根据 图 7.4 中 尖 示 的 设置 ， 其 可 用 优先 级 的 具体 情况 如 图 7.5 所 示 。 
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OxC0 


OxE0 


OxFF 





最 低 优 先 级 




















0 —x— -3 
—x— -2 —x— -2 子 优先 级 
= — Xx— -1 
0 
0 0 
—x— 0x20 — x— Ox20 
— Xx— Ox40 一 兴 一 Ox40 ~ 一 兴 一 Ox40 
— x— Ox60 —x— ox60 
— x— Ox80 — x— 0x80 ~ 一 兴 一 ox80 
一 兴 OxA0 — x— OxAO 
— x— oxco —x— OxC0 ~ — Xx— OxC0 
—X— OxE0 一 一 一 OxE0 
7.5 ”三 位 优先 级 ， 从 比特 5 处 分 组 


泪 
J] 
莽 


请 注意 : 虽然 [4:8] 示 使 用 ， 却 允许 从 它们 中 分 组 。 例如， 如 果 优 先 级 组 为 1， 则 所 有 可 用 的 8 
个 优先 级 都 是 抢占 优先 级 ， 如 疼 7.6 和 图 7.7 所 示 。 


二 Ts 。 。 国 加 








抢占 优先 级 [7:5] 抢占 优先 级 [4:2] 亚 优先 级 [1:0] 
( 未 使 用 ) ( 未 使 用 ) 


7.6 3 位 优先 级 ， 从 比特 1 处 分 组 
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使 用 3 个 位 来 

最 高 优先 级 表达 优先 级 从 比特 1 处 分 组 

—3 复位 一 关 一 -3 一 关 一 一 3 

-2 二 EN 一 一 一: 一 一 -2 子 优先 级 

一 1 硬 fault 一 一 < 一 一 1 一 一 和 一 一 1 

0 Eee 0 

0 0 

0x20 —>%X— 0x20 一 0x20 — ©— > 0x20 

Ox40 —X— 0x40 —X— 0x40 —— — > 0x40 

Ox60 — xX— 0x60 一 一 0x60 “一 -> ©— > 0x60 

0x80 一 0x80 —X— 0x80 —” 一 人 和 一 0x80 

OxAO0 -一 > 和 < 一 0xA0 —X— 0xXA0 “一 -> 一 光一 0xA0 

0xC0 — xX— 0xC0 -一 0xC0 “一 一 > 人 一 0xC0 

0xE0 一 > 和 一 0xE0 -> 和 一 0xE0 “一 一 > 一 > 和 一 0xE0 

OxFF 

最 低 优 先 级 


7.7 ”3 位 优先 级 ， 从 比特 1 处 分 组 ， 详细 情况 











如 果 优 先 级 完全 相同 的 多 个 异 冲 同时 悬 起， 则 先 啊 应 异 第 编号 最 小 的 那 一 个 。 例 如 ， 当 IRQ #3 的 
优先 级 与 IRQ #5 的 优先 级 相等 时 ，IRQ #3 会 比 IRQ #5 先 得 到 响应 。 

虽然 优先 级 分 组 的 功能 很 强大 ， 但 是 粗心 地 更 改 会 使 它 变 得 很 参 力 ， 尤 其 是 在 设计 便 实 时 系统 
的 时 候 ， 这 价 直 束 是 在 玩 火 一 一 党 党 会 改变 系统 的 啊 应 特性 。 导 致 某 些 关 键 任 务 有 可 能 得 不 到 及 时 
啊 应 ， 节 多 言 少 的 意外 随时 可 能 狐 列 发作。 其 实在 绝 大 多 数 情 况 下 ， 优 先 级 的 分 组 都 要 预先 经 过 计 
算 论 证 ， 并 且 在 开机 初始 化 时 一 次 性 地 设置 好 ， 以 后 台 再 也 不 动 它 了 。 只 有 在 绝对 需要 且 绝 对 有 把 
握 时 ， 才 小 心地 更 改 ， 并 且 要 经 过 尽 可 能 充分 的 测试 。 另 外 ， 优 先 级 组 所 在 的 寄存 器 AIRCR 《回顾 
表 7.5) 也 基本 上 是 “一 次 成 型 ” 只 是 需要 手工 产生 复位 时 才 写 里 面相 应 的 位 。 





























7.3 ”向 量 表 





当 发 生 了 开 利 并 且 要 啊 应 它 时 ，CM3 需要 定位 其 服务 例 程 的 入 口 地 址 。 这 些 入 口 地 址 存储 在 所 




















每 个 表 项 占用 4 子 市 ， 如 表 7.6 所 示 。 
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表 7.6 上 电 后 的 向 量 表 


全 (37 位 要) 
oxeoo0_6000 | -| MSP 的 初 信人 
复位 向 量 (PC 和 下 人 


NMT 服务 例 程 的 入 口 地 址 
硕 fault 服务 例 程 的 入 口 地 下 
|- | 其 它 异 常服 务 例 程 的 入 口 地 址 








因为 地 址 8 处 应 该 存储 引导 代码 ， 所 以 它 通 常 映射 到 Flash 或 者 是 ROM 器 件 , 并 且 它 们 的 值 不 
得 在 运行 时 改变 。 然 而 ， 为 了 文 持 动态 重 分 发 中 断 ，CM3 人 允许 癌 量 表 重 定位 一 一 从 其 它 地 址 处 开始 
定位 各 异常 癌 量 。 这 些 地 址 对 应 的 区 域 可 以 是 代码 区 ,但 更 多 是 在 RAM 区 。 在 RAM 区 就 可 以 修改 癌 
量 的 入 口 地 址 了 。 为 了 实现 这 个 功能 ，NVIC 中 有 一 个 寄存 器 ， 称 为 “ 癌 量 表 偏 移 量 寄存 器 ”( 在 地 
址 6xE666_ED68 处 )， 通 过 修改 它 的 值 就 能 重 定位 问 量 表 。 但 必须 注意 的 是 : 问 量 表 的 起 始 地 址 是 
有 要 求 的 : 必须 先 求 出 系统 中 共有 多 少 个 同 量 ， 再 把 这 个 数字 网 上 “ 圆 整 ”到 2 的 整 次 蜂 ， 而 起 始 
地 址 必须 对 齐 到 后 者 的 边界 上 。 例 如 ， 如 果 一 共有 32 个 中 断 ， 则 共有 32+16 (系统 异常 =48 个 
问 量 ， 问 上 圆 整 到 2 的 整 次 早 后 值 为 64， 因 此 问 量 表 重 定位 的 地 址 必须 能 被 64*4=256 整除 ， 从 而 
合法 的 起 始 地 址 可 以 是 : 6x86，6x1686，6x266 等 。 向 量 表 偏 移 量 寄存 器 的 定义 如 表 7.7 所 示 。 


表 7.7 ”向 量 表 偏 移 量 家 和 存 器 (VTOR) ( 地 址 : 0xE000_ED08 ) 









































位 段 ”名 称 类 型 ”复位 值 描述 
7-28 TBLOFF RW 9 问 量 表 的 起 始 地 址 
29 TBLBASE R 向 量 表 是 在 Code 区 06)， 还 是 在 RAM 区 (1) 


如 果 和 需要 动态 地 更 改 癌 量 表 ， 则 对 于 任何 器 件 来 说 ， 问 量 表 的 起 始 处 都 必须 包含 以 下 问 量 : 

@ 主 堆 栈 指 针 MSP) 的 初始 值 

@ 复位 癌 量 

@ NMI 

@ 便 fault 服务 例 程 

后 两 者 也 是 必需 的 ， 因 为 有 可 能 在 引导 过 程 中 发 生 这 两 种 异常 。 

可 以 在 SRAM 中 开 出 一 块 空间 用 于 存储 向 量 表 。 在 引导 期 间 先 填写 好 各 向 量 ， 然 后 在 引导 完成 
就 可 以 启用 内 存 中 的 新 间 量 表 ， 从 而 实现 向 量 可 动态 调整 的 能 























后 


7.4 ”中 断 输 入 及 县 起 行为 


本 市 开始 讨论 中 断 的 输入 和 蕊 起 行为 。 这 也 适用 于 NMI， 只 是 对 于 NMI 来 说 ， 除 了 一 些 特殊 情 
况 之 外 , 将 会 立即 无 条 件 执行 其 服务 例 程 。 这些 特殊 情况 包括 : 当前 已 经 在 执行 NMI 服务 例 程 ， CPU 
被 调试 器 喊 停 (halted); CPU 被 一 些 严 重 的 系统 错误 锁定 (Lock up)。 则 新 的 NMI 请 求 也 将 悬 起 。 
译注 : 并 不 是 每 种 lock up 都 会 除 能 NMI。 这 是 比较 深入 的 学 习 ， 详 情 参考 第 12 章 。 


这 
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泪 
J] 
th 


中 断 延 迟 


中 断 请 求 ~ 


中 断层 起 状态 


] Handler 模 式 





处 理 器 ”线程 模式 
模式 


图 7.8 “中断 悬 起 示意 图 
当中 断 输入 脚 被 置 为 有 效 (asser) 荆 后, 该 中 断 束 补 芒 起 。 即 使 后 来 中 断 源 撤消 了 中 断 请 求 ， 
已 经 被 标记 成 悬 起 的 中 断 也 被 记录 下 来 。 到 了 系统 中 它 的 优先 级 最 高 的 时 候 ， 就 会 得 到 响应 。 
但 是 ， 如 果 在 某 个 中 断 得 到 啊 应 之 且 ， 其 县 起 状态 被 清除 了 例如， 在 PRIMASK 或 FAULTMASK 
署 位 的 时 候 软 件 清 除了 其 起 状态 标志 )， 则 中 断 被 取消 ， 如 网 7.9 所 示 。 


hi 上  [L 


\ 


























中 断 悬 起 状态 | 
县 起 状态 被 软件 清除 
处 理 器 线程 模式 
模式 





图 7.9 ”中 断 在 得 到 处 理 器 响应 之 前 被 清除 悬 起 状态 





当 东 中 断 的 服务 例 程 开 始 执行 时 ， 瓯 称 此 中 断 进 入 了 “活跃 ”状态 ， 并 且 其 巧 起 位 会 被 使 件 目 
动 消除 ， 如 图 7.16 所 示 。 在 一 个 中 断 活跃 后， 直到 其 服务 例 程 执 行 完 毕 ， 并 且 返 回 ( 亦 称 为 中 断 
退出 ， 第 九 章 详细 讨论 ) 后 ， 才 能 对 该 中 断 的 新 请 求 予以 响应 〈 单 实例 )。 当 然 ， 新 请 求 在 得 到 响 
应 时 ， 亦 是 由 便 件 目 动 清和 零 其 蕉 起 标记 人 位。 中 断 服务 例 程 也 可 以 在 执行 过 程 中 把 目 己 对 应 的 中 断 重 
狐 上 巷 起 使 用 时 要 注意 避 多 进入 “ 死 循 环 ” 一 一 协 E )。 
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中 断 请 求 被 


软件 清除 
wu 


请 求 \ 












中 断 活跃 状态 








Handler 模式 tC 中 断 返 回 





处 理 避 线程 模式 
模式 





图 7.10 在 处 理 器 进入 服务 例 程 后 对 中 断 活跃 状态 的 设置 
如 果 中 断 源 咬 住 请 求 信号 不 放 ， 访 中断 束 会 在 其 上 次 服务 例 程 返回 后 再 次 被 置 为 惹 起 状态 ， 如 
7.11 所 示 。 这 一 点 上 CM3 和 传统 的 ARM7TDMI 是 相同 的 。 
中 断 请 求 信号 一 直 保 持 


中 断 


请 求 \ 








中 断 活跃 状态 | 中 断 返 回 


Handler 模 式 


处 理 器 。” ”线程 模式 再 次 进入 中 上 断 服务 例 程 


模式 





图 7.11 一 直 维 持 的 中 断 请 求 导 用 服务 例 程 返回 后 再 次 悬 起 该 中 断 
另 一 方面 ， 如 果 某 个 中 断 在 得 到 啊 应 之 前 ， 其 请 求 信 号 以 独 干 的 脉冲 的 方式 呈现 ， 则 被 视 为 只 
有 一 次 中 断 请 求 ， 多 出 的 请 求 脉冲 全 部 错失 一 一 这 是 中 断 请求 太 快 ， 以 致 于 超出 处 理 器 反应 限度 的 
情况 。 如 图 7.12 所 示 。 
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在 进入 ISR 前 曾 有 过 多 次 请 求 脉冲 





Handler 模 式 





处 理 器 中 断 返 回 


模式 





线程 模式 


7.12 中 断 请 求 过 快 导 致 一 部 分 请 求 错失 的 情况 
如 果 在 服务 例 程 执行 时 ， 中 断 请 求 释放 了 ， 但 是 在 服务 例 程 返回 前 又 重新 被 置 为 有 效 ， 则 CM3 
会 记 住 此 动作 ， 重 新 其 起 该 中 断 。 如 图 7.13 所 示 。 
新 的 中 断 请 求 脉 冲 








中 断 


请 求 \ 


中 断 活 跃 状态 | ] 


Handler 模 式 








中 断 返回 
处 理 器 。 ”线程 模式 重新 进入 ISR 
模式 


7.13 在 执行 ISR 时 中 断 悬 起 再 次 友 生 


7.5 Fault 类 异 尝 





有 若干 个 系统 异常 专用 于 fault 处 理 。CM3 中 的 Faults 可 分 为 以 下 几 类 : 
@ 总线 faults 

@ 存储 髓 管理 faults 

@ 用 法 faults 


119 


Cortex-M3 权威 指 丙 


泪 
J] 
姓 


@ 健 fault 


7.5.1 总 线 Faults 


当 AHB 接口 上 正在 传送 数据 时 ， 如 果 回 复 了 一 个 错误 信号 (error response)， 则 会 产生 总 线 
faults， 产 生 的 场合 可 以 是 : 

@ 取 指 ， 通 第 被 称 作 “ 预 取 流产 ”(prefetch abort ) 

@ 数据 读 / 写 ， 通 各 被 称 作 “数据 流产 ”(data abort ) 

在 CM3 中 ， 执 行 如 下 动作 时 ， 如 果 地 址 有 误 ， 亦 会 触发 总 线 异 常 : 

@ 中断 处 理 起 始 阶段 的 堆栈 PUSH 动作 。 此 时 辱 发生 总 线 fault， 则 称 为 “入 栈 错 误 ” 

@ 中断 处 理 收尾 阶段 的 堆栈 POP 动作 。 此 时 若 发 生 总 线 fault， 则 称 为 “出 栈 错误 ” 

@ 在 处 理 右 司 动 中 断 服 务 序列 (sequence) 后 读 取 同 量 时 。 这 是 一 种 极度 罕见 的 特殊 情况 ， 

被 归 类 为 便 fault。 














哪些 因素 会 导致 AHB 回复 一 个 错误 信号 ? 


AHB 回复 的 错误 信号 会 触发 总 线 fault， 诱 因 可 以 是 : 

@ 企图 访问 无 效 的 存储 器 region。 第 见于 访问 的 地 址 没有 相对 应 的 存储 器 。 

@ 设备 还 没有 作 好 传送 数据 的 准备 。 比 如 ， 在 尚未 初始 化 SDRAM 控制 器 的 
时 候 试 图 访问 SDRAM。 

@ 在 企图 启动 一 次 数据 传送 时 ， 传送 的 尺寸 不 能 为 目标 设备 所 支持 。 例 如 ， 
菜 设 备 只 接受 字 型 数据 ， 却 试图 送 给 它 字 节 型 数据 。 

@ 因为 菜 些 原因 , 设备 不 能 接受 数据 传送 。 例 如， 菜 些 设备 只 有 在 特权 级 下 
才 允许 访 问 ， 可 当前 却 是 用 户 级 。 








当 上 述 这 些 总 线 faults 发 生 时 (取向 量 的 除外 ), 只 要 没有 同 级 或 更 高 优先 级 的 异常 正在 服务 ， 

且 没 有 被 掩蔽 ， 就 会 执行 总 线 fault 的 服务 例 程 。 如 果 在 检测 到 总 线 fault 时 还 检测 到 了 更 高 优 

先 级 的 异常 ， 则 先 处 理 后 者 ， 而 总 线 fault 被 标记 成 悬 起 。 最 后 ， 如 果 总 线 fault 被 除 能 ， 或 者 

总 线 fault 是 被 某 同 级 或 更 高 优先 级 异常 的 服务 例 程 引发 的 ， 则 总 线 fault 被 迫 成 为 “ 便 伤 ”一 

一 上 访 成 硬 fault， 使 得 最 后 执行 的 是 硬 fault 的 服务 例 程 《如果 当 前 没有 执行 NMI 服务 例 程 ， 则 

立即 执行 硬 fault 服务 例 程 一 一 译 者 注 )。 如 果 在 硬 fault 服务 例 程 的 执行 中 又 产生 了 总 线 fault 
( 太 钻 牛角 尖 了 )， 内 核 将 进入 锁定 状态 (第 12 章 详细 讨论 )。 




















欲 使 能 总 线 fault 服务 例 程 ， 需 要 在 NVIC 的 “系统 Handler 控制 及 状态 寄存 器 ”中 置 位 
BUSFAULTENA 位 。 要 注意 的 是 : 在 使 能 之 前 ， 总 线 fault 服务 例 程 的 入 口 地 址 必须 已 经 在 向 量 表 
中 配置 好 ， 否 则 就 成 了 作法 自 纤 一 一 程序 可 能 跑 飞 。 








那么 ， 发 生 了 总 线 fault 后 ， 我 们 将 如 何 找 出 该 fault 的 事故 原因 呢 ? 在 这 里 ，NVIC 提供 了 
若干 个 fault 状态 寄存 器 , 其 中 一 个 名 为 “总 线 fault 状态 寄存 器 ”(BFSR) 的 ,通过 它 , 总 线 fault 
服务 例 程 可 以 确定 产生 fault 的 场合 : 是 在 数据 访问 时 ， 在 取 指 时 ， 还 是 在 中 断 的 堆栈 操作 时 。 





对 于 精确 的 总 线 fault〈( 见 下 框 说 明 )， 後 事 指令 的 地 址 被 压 在 堆栈 中 。 如 果 BFSR 中 的 
BFARVALID 位 为 1, 还 可 以 找 出 是 在 访问 哪 块 存储 器 时 产生 该 总 线 fault 的 一 一 该 存储 融 的 地 址 被 
放 到 “总 线 fault 地 址 寄存 器 (BFAR)” 中 。 然 而 ， 如 果 是 不 精确 的 总 线 fault， 束 无 从 定位 了 。 
因为 在 发 生 fault 时 ， 处 理 吉 已 经 在 执行 肇事 指令 后 ， 不 知 又 流 馆 了 多 少 个 周期 了 。 
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精确 的 总 线 fault vs. 不 精确 的 总 线 fault 


由 数据 访问 产生 的 总 线 fault， 可 以 进一步 被 归 类 为 精确 总 线 fault 和 不 精确 总 
线 fault。 在 不 精确 的 总 线 faults 中 ， 导 和 致 此 fault 的 指令 早已 完成 了 。 例 如 ,缓冲 区 
写 入 。 启 动 缓冲 区 写 入 的 指令 不 知 何 时 已 经 执行 了 ,但 是 写 到 中 途 时 触发 了 总 线 
fault。 此 时 ,常事 指令 早已 “ 逃 选 ”一 一 在 若干 个 时 钟 周期 就 执行 过 了 ,而且 不 能 
确定 是 具体 几 个 周期 之 前 ，CM3 也 不 会 记录 这 期 间 的 程序 跳 转 动作 。 因 此 无 法 确 
认 “ 和 世事 者 ”， 故 而 该 fault 是 不 精确 的 。 精 确 的 总 线 fault 则 不 同 ， 它 是 被 最 后 一 
个 完成 的 操作 和 触发 的 。 例 如 ， 一 个 存储 器 读 取 寻 致 的 fault 总 是 精确 的 ， 因 为 该 指 
令 必 须 等 全 部 读 完 时 才 算 执行 完成 。 这 样 ， 任 何在 读 取 过 程 中 发 生 的 fault 总 能 落 
在 该 指令 的 头 上 。 


BFSR 寄存 器 的 程序 员 模 型 如 下 所 示 : 它 是 一 个 8 位 的 寄存 器 ， 并 且 可 以 使 用 字 传 送 和 字 节 传 
送 来 读 取 它 。 如 果 以 字 方 式 访问 ， 地 址 是 exE666 ED28， 并 且 第 2 个 字 节 有 效 ; 如 果 以 字 节 方式 访 
问 ， 则 地 址 直接 就 是 6xE686 ED29， 如 表 7.8 所 示 。 





表 7.8 总 线 fault 状态 寄存 器 (BFSR) ， 地 址 : 0xE000_ED29 


了 BFARVALID - ,8 -1 时 表示 BFAR 有 效 
EDEN 和 S33 和 ng 
4 SIKERR RW e 入 栈 时 发 和 销 误 


3 UNSTKERR | R/We 8 | 出 校 时 发 铺 训 

2 INPRECISERR RJWe 8 不 情 确 的 所 访问 时 何 Cviolation) 
1 pRECISERR |R/We 8 | 靖 的 数据 访问 过 人 
BusERR RNc 6 了 到 指 时 的 二 人 


7.5.2 存储 器 管理 faults 


存储 占 管 理 faults 多 与 MPU 有 天, 其 诱因 常常 是 作 次 访问 触犯 了 MPU 设置 的 保护 规范 。 为 外 ， 
某 些 非法 访问 ， 例 如 ， 在 不 可 执行 的 存储 器 区 域 试 图 取 指 ， 也 会 触发 一 个 MemManage fault， 而 
且 在 这 种 场合 下 ， 即 使 没有 MPU 也 会 触发 MemMange fault。 

MemManage faults 的 常见 诱因 如 下 所 示 : 

@ 访问 了 所 有 MPU regions 和 窗 盖 范围 之 外 的 地 址 

@ 访问 了 没有 存储 喜与 乙 对 应 的 空地 址 

@ 人 往 只 读 region 写 数 据 

@ 用户 级 下 访问 了 只 允许 在 特权 级 下 访问 的 地 址 

在 MemManage fault 发 生 后 ， 如 果 其 服务 例 程 是 使 能 的 ， 则 执行 服务 例 程 。 如 果 同 时 还 发 生 
了 其 它 噩 优先 级 寞 第 ， 则 优先 处 理 这 些 高 优先 级 的 寞 前 ，MemManage 异 利 被 巧 起 。 如 果 MemMange 
fault 是 被 同 级 或 高 优先 级 异常 的 服务 例 程 引发 的 ,或 者 MemManage fault 被 除 能 , 则 和 总 线 fault 
一 样 ， 上 访 成 便 fault， 最 终 执行 的 是 便 fault 的 服务 例 程 。 如 果 便 fault 服务 例 程 或 NMI 服务 
例 程 的 执行 也 导致 了 MemManage fault， 那 就 不 可 救 要 了 一 一 内 核 将 被 锁定 。 
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可 见 ， 和 总 线 fault 一 样 ，MemManage fault 必须 被 使 能 才能 正常 啊 应 。MemManage fault 
在 NVIC“ 系 统 handler 控制 及 状态 寄存 器 ”中 的 使 能 位 是 MEMFAULTENA。 如 采 把 问 量 表 置 于 RAM 
中 ， 应 优先 建立 好 MemManage fault 服务 例 程 的 入 口 地 址 。 

为 了 调查 MemManage fault 的 案 发 现场 ，NVIC 中 有 一 个 “存储 器 管理 fault 状态 寄存 器 
CMFSR)” ， 它 指出 导致 MemManage fault 的 原因 。 如 果 是 因为 一 个 数据 访问 违例 CDACCVIOL 位 ) 
或 是 一 个 取 指 访问 违例 (IACCVIOL 位 )， 则 违例 指令 的 地 址 已 经 被 压 入 栈 中 。 如 采 还 有 MMARVALID 
位 被 置 位 ， 则 还 能 进一步 得 出 引发 此 fault 时 访问 的 地 址 一 一 谈 取 NVIC“ 存 储 占 管理 地 址 寄存 右 

(MMAR)” 的 值 。 

MFSR 寄存 器 的 程序 员 模 型 如 下 所 示 。 它 是 一 个 8 位 的 寄存 器 ， 并 且 可 以 使 用 字 传 送 和 字 节 传 
送 来 读 取 它 。 不 管 使 用 哪 种 访问 方式 ， 地 址 都 是 @xE668 ED28。 只 不 过 如 果 按 字 访 问 ， 就 只 有 第 1 
个 字 节 有 意义 。 如 表 7.9 所 示 。 























表 7.9 存储 器 管理 fault 状态 寄存 器 (MFSR)， 地 址 : 0xE000_ED28 


位 自 类 型 ”复位 值 
=1 时 表示 MMAR 有 效 
6:5 | 
4 入 栈 时 发 生 错误 
[a 出 栈 时 发 生 错误 
So 





不 
R/Wc 数据 访问 违例 
@ IACCVIOL R/Wc 取 指 访问 违例 


7.5.3 用 法 faults 


用 法 faults 发 生 的 场合 可 以 是 : 
@ 执行 了 协 处 理 器 指令 。Cortex-M3 本 身 并 不 支持 协 处 理 器 , 但 是 通过 fault 异常 机 制 ， 可 





以 建立 一 套 “ 软 件 模 拟 ” 的 机 制 ， 来 执行 一 段 程 序 模拟 协 处 理 右 的 功能 ， 从 而 可 以 方便 地 
在 其 它 Cortex 处 理 器 间 移 植 。 
@ 执行 了 未 定义 的 指令 。 同 上 一 点 的 道理 ， 亦 可 以 软件 模拟 未 定义 指令 的 功能 。 
@ ”尝试 进入 ARM 状态 。 因 为 CM3 不 支持 ARM 状态 ， 所 以 用 法 fault 会 在 切换 时 产生 。 和 软件 
可 以 利用 此 机 制 来 测试 某 处 理 器 是 否 文 持 ARM 状态 。 
@ 无效 的 中 断 返 回 (LR 中 包含 了 无 效 / 错 误 的 值 ) 
@ 使 用 多 重 加 载 / 存 储 指 令 时 ， 地 址 没有 对 章 。 
另外 ， 如 果 需 要 严格 要 求 程序 的 质量 ， 还 可 以 让 CM3 在 遇 到 除数 为 零 的 时 候 ， 以 及 遇 到 未 对 齐 
访问 的 时 候 也 产生 用 法 fault。 在 NVIC 中 有 两 个 控制 位 分 别 与 它们 对 应 。 通过 设置 这 两 个 控制 位 ， 
就 可 以 激活 它们 。 
在 使 能 了 用 法 fault 后 ， 如 果 在 用 法 fault 发 生 的 时 候 ， 己 经 其 起 了 更 高 优先 级 的 异常 ， 则 
































低 于 用 法 fault 的 优先 级 ; 或 者 用 法 fault 航 除 能 ， 则 和 总 线 fault 与 MemManage fault 一 样 ， 
用 法 fault 上 访 成 硬 fault， 最 终 执行 的 是 硬 fault 的 服务 例 程 。 如 果 硬 fault 服务 例 程 或 NMI 
服务 例 程 的 执行 葛 然 也 引发 了 用 法 fault, 那 就 不 可 救 要 了 一 一 内 核 义 将 被 锁定 ( 丰 不 嫌 咏 明 啊 )。 
可 见 ， 和 总 线 fault 与 MemManage fault 一 样 ， 用 法 fault 必须 被 使 能 才能 正常 响应 。 用 法 
fault 在 NVIC“ 系 统 handler 控制 及 状态 寄存 句 ” 中 的 使 能 位 是 USGFAULTENA。 如 果 把 问 量 表 置 


于 RAM 中 ， 应 优先 建立 好 用 法 fault 服务 例 程 的 入 口 地 址 (其实 作 者 的 本 意 是 : 应 先 建 立 好 fault 
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关 弄 冲服 务 例 程 的 入 口 地 址 ， 再 建立 其 它 卉 各 服务 例 程 的 入 口 地 址 一 一 详 者 注 )。 


为 了 调 碍 用 法 fault 的 染发 现场 ，NVIC 中 有 一 个 “用 法 fault 状态 寄存 左 CUFSR)”， 过半 出 
导致 用 法 fault 的 原因 。 在 服务 例 程 中 ， 导 致 用 法 fault 的 指令 地 址 被 压 入 堆栈 中 。 


何 时 会 意外 地 试图 切入 ARM 状态 


导致 用 法 fault 的 最 常见 原因 就 是 试图 切入 ARM 状态 。 只 要 在 加 载 PC 时 使 用 
了 LSB 为 零 的 数 (也 就 是 偶数 ) ， 就 被 视 作 试图 切入 ARM 状态 ， 包 括 : 

执行 “BX Rn” 指 令 时 ，Rn 的 LSB=0 

异常 向 量 表 中 入 口 地 址 的 LSB=0 

POP {..,PC} 时 ， 弹 出 的 数值 LSB=0， 这 常常 是 入 栈 的 值 被 手工 改 坏 造 成 的 

在 上 述 原因 导致 了 用 法 fault 后 ，UFSR 中 的 INVSTATE 位 (INValid STATE) 会 置 位 。 


UFSR 的 定义 如 图 7.16 所 示 。 它 占用 了 2 个 字 季 ， 可 以 被 按 半 字 访问 或 是 按 字 访问 。 按 字 访 问 
时 的 地 址 是 @xE688_ED28， 局 半 邹 有 效 ; 按 半 凶 访 问 时 的 地 址 是 exE668_ED2A。 和 其 它 的 FAULT 
状态 寄存 器 一 样 ， 它 里 面 的 位 可 以 通过 写 1 来 清 零 。 





表 7.10 用 法 fault 状态 寄存 器 (UFSR)， 地址 : 0xE000_ED2A 


8 。 | NALTeNED | RAwe | 8 | 未 对 并 访问 至 的 fault 
DMITEEDW Cm Er 
3 No |R/We e | 试 几 执行 洲 处 理 吕 相关 指令 


STATE nc 6 | 斌 轿 切 入 ARM 关 在。 





7.5.4 使 fault 


便 fault 是 上 文 讨论 的 总 线 fault、 存 储 器 管理 fault 以 及 用 法 fault 上 访 的 结果 。 如 果 这 
些 fault 的 服务 例 程 无 法 执行 ， 它 们 就 会 成 为 “ 便 伤 ”一 一 上 访 (escalation) 成 硬 fault。 田 
外 , 在 取向 量 (异常 处 理 时 对 异常 向 量 表 的 读 取 ) 时 产生 的 总 线 fault 也 按 便 fault 处 理 。 在 NVIC 
中 有 一 个 便 fault 状态 寄存 器 (HFSR), 它 指出 产生 便 fault 的 原因 。 如果 不 是 由 于 取 问 量 造 成 的 ， 
则 硬 fault 服务 例 程 必须 检查 其 它 的 fault 状态 寄存 器 ， 以 最 终 决定 是 谁 上 访 的 。 

HFSR 的 定义 如 表 7.11 所 示 。 

















表 7.11 便 fault 状态 寄存 器 (地 址 : 6xE866_ED2C ) 
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31 DEBUGEVT RWc e 人 硬 fault 因 调试 事件 而 产生 


FORCED R/Wc 人 硬 fault 是 被 上 访 的 。 上 访 者 可 以 是 总 线 
fault、 存 储 器 管理 fault 或 是 用 法 fault 


OOo“«“t’rIr«’“’“‘“ 
1 JVECTBL |R/Wc je | 硬 fault 是 在 取向 量 时 发 和 的 
人 


7.5.5 应 对 faults 


在 软件 开发 过 程 中 , 我 们 可 以 根据 各 种 fault 状态 寄存 器 的 值 来 判定 程序 错误 , 并 且 改 正 它 们 。 
附录 E 给 出 了 各 种 faults 的 常见 诱因 ， 以 及 应 对 攻略 。 

然而 ， 在 一 个 实时 系统 中 ， 情 况 则 大 不 相同 。 发 生 了 Faults 后 ， 如 果 不 加 以 处 理 常 会 危及 系 
统 的 运行 。 因 此 在 找 出 了 导致 fault 的 原因 后 ， 软 件 必须 决定 下 一 步 该 怎么 人 办。 如果 系 统 中 运行 了 
一 个 RTOS,， 通常 是 终结 後 事 的 任务 。 在 其 它 情 况 ， 系 统 也 许 必须 要 复位 。 在 不 同 的 目标 应 用 中 ， 对 
fault 恢复 的 要 求 也 不 同 。 总 的 来 说 ， 采 取 适 当 的 策略 有 利于 软件 更 健壮 一 一 当然 最 好 还 是 防 患 于 
未 然 。 下 面 就 给 出 一 些 应 付 fault 的 常用 方法 。 

复位 。 这 也 是 最 后 一 招 。 通 过 设置 NVIC“ 应 用 程序 中 断 及 复位 控制 寄存 器 ”中 的 VECTRESET 
位 ， 将 只 复位 处 理 器 内 核 而 不 复位 其 它 片 上 设施 。 取 决 于 世 片 的 复位 设计 ， 有 些 CM3 芯片 可 以 使 用 
该 寄存 器 的 SYSRESETREQ 位 来 复位 。 这 种 只 限于 内 核 中 的 复位 不 会 殊 及 其 它 的 系统 部 件 。 

恢复 : 在 一 些 场合 下 ， 还 是 有 希望 解决 产生 fault 的 问题 的 。 例 如 ， 如 果 程 序 尝试 访问 了 协 处 
理 髓 ， 可 以 通过 一 个 协 处 理 颖 的 软件 模拟 器 来 解决 此 问题 一 一 当然 是 以 牺牲 性 能 为 代价 的 ， 要 不 然 
还 要 硬件 加 速 干 啥 。 

中 止 相关 任务 : 如 果 系 统 运 行 了 一 个 RTOS， 则 相关 的 任务 可 以 被 终结 或 者 重新 开始 。 


















































各 个 fault 状态 寄存 器 (FSRs) 都 保持 住 它 们 的 状态 ， 直 到 手工 清除 。Fault 服务 例 程 在 处 理 
了 相应 的 fault 后 不 要 未 记 清 除 这 些 状态 ， 人 否则 如 果 下 次 又 有 新 的 fault 发 生 ， 服 务 例 程 在 检视 
fault 源 时 ， 又 将 看 到 早先 已 经 处 理 的 fault 遗留 下 来 的 状态 标志 。 此 时 ， 将 无 法 判断 哪个 fault 
是 狐 发 生 的 。FSRs 采用 一 个 写 时 清除 机 制 ( 写 1 时 清除 )。 

必 片 厂商 也 可 以 再 添加 自己 的 FSR， 以 表示 其 它 fault 情况 。 














7.6  SVC 和 PendSV 





注意 : 阅读 本 节 的 后 面 需要 一 点 点 多 任务 编程 的 基础 知识 一 一 详 者 注 

SVC《〈 系 统 服务 调用 ， 亦 简称 系统 调用 ) 和 PendsV“《〈 可 悬 起 系统 调用 )， 它 们 多 用 在 上 了 操作 
系统 的 软件 开发 中 。SVC 用 于 产生 系统 函数 的 调用 请 求 。 例 如 ， 操 作 系 统 通 利 不 让 用 户 程序 直接 访 
问 便 件 ， 而 是 通过 提供 一 些 系统 服务 函数 ， 让 用 户 程 序 使 用 SVC 友 出 对 系统 服务 函数 的 呼叫 请 求 ， 
以 这 种 方法 调用 它们 来 间接 访问 使 件 。 因 此 ， 当 用 户 程 序 想 要 控制 特定 的 便 件 时 ， 它 融 要 产生 一 个 
SVC 开 毅 ， 然 后 操作 系统 提供 的 SVC 和 卉 第 服务 例 程 得 到 执行 ， 它 再 调用 相关 的 操作 系统 函数 ， 后 者 
完成 用 户 程序 请 求 的 服务 。 

这 种 “提出 要 求 一 一 得 到 满足 ”的 方式 ， 很 好 、 很 强大 、 很 方便 、 很 灵活 、 很 能 可 持续 发 展 。 
首先 ， 它 使 用 户 程序 从 控制 使 件 的 索 文 捧 蔬 中 解 脐 出 来 ， 而 是 由 0S 负 贡 控制 具体 的 便 件 。 第 二 ， 
0s 的 代码 可 以 经 过 充分 的 测试 ， 从 而 能 使 系统 更 加 健壮 和 可 蚕 。 第 三 ， 它 使 用 户 程 序 无 需 在 特权 级 
下 执行 ， 用 户 程序 无 需 承 担 因 误 操 作 而 凑 痪 整个 系统 的 风险 。 第 四 ， 通 过 SVc 的 机 制 ， 还 让 用 户 程 
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序 变 得 与 便 件 无 关 ， 因 此 在 开发 应 用 程序 时 无 需 了 解 便 件 的 操作 细节 ， 从 而 傈 化 了 开发 的 难度 和 过 
琐 度 ， 并 且 使 应 用 程序 路 便 件 平台 移植 成 为 可 能 。 开 发 应 用 程序 唯一 需要 知道 的 就 是 操作 系统 提供 
的 应 用 编程 接口 (API), 并 有 旦 在 了 解 了 各 个 请 求 代 写 和 参数 表 后 , 束 可 以 使 用 SVC 来 提出 要 求 了 (〈 事 
实 上 ， 为 使 用 方便 ， 操作 系 统 往往 会 提供 一 层 封皮 ， 以 使 系统 调用 的 形式 看 起 来 和 普通 的 函数 调用 
一 致 。 各 封皮 函数 会 正确 使 用 SVC 指令 来 执行 系统 调用 一 一 译 者 注 )。 其 实 ， 严 格 地 讲 ， 操 作 硬 件 
的 工作 是 由 设备 驱动 程序 完成 的 ,只 是 对 应 用 程序 来 说 ,它们 也 相当 于 操作 系统 的 一 部 分 。 如 图 7.14 
所 不 




















特权 级 










操作 系统 的 内 核 





| 
| 
| 
| 
非特 权 级 
| 













几 Ld 
程序 调用 解释 器 Ee 外 部 设备 
| 


7.14 SVC 作为 操作 系统 函数 门户 示意 图 
SVC 异常 通过 执行 "SVC” 指 令 来 产生 。 该 指令 需要 一 个 立即 数 ， 充 当 系统 调用 代号 。SVC 异常 








服务 例 程 稍 后 会 提取 出 此 代号 ， 从 而 获知 本 次 调用 的 具体 要 求 ， 再 调用 相应 的 服务 函数 。 例 如 ， 
SVC 6x3 ; 调用 3 号 系统 服务 
在 SVC 服务 例 程 执行 后 ， 上 次 执行 的 SVC 指令 地 址 可 以 根据 自动 入 栈 的 返回 地 址 计算 出 。 找 到 
了 SVC 指令 后 ， 就 可 以 读 取 该 SVC 指令 的 机 器 码 ， 从 机 器 码 中 萃取 出 立即 数 ， 就 获知 了 请 求 执行 的 
功能 代号 。 如 果 用 户 程序 使 用 的 是 PSP， 服 务 例 程 还 需要 先 执行 MRS Rn，PSP 指令 来 获取 应 用 程序 
的 堆栈 指针 。 通 过 分 析 LR 的 值 ， 可 以 获知 在 SVC 指令 执行 时 ， 正 在 使 用 哪个 堆栈 (细节 在 第 8 章 
中 讨论 )。 


SVC vs. SWI 
如 果 你 曾 使 用 过 其 它 的 ARM 处 理 器 (如 ARM7)， 你 也 许 会 知道 那里 有 一 个 被 称 为 
“软件 中 断 ” 的 指令 (SWI)。SVC 的 地 位 与 SWI 是 相同 的 一 一 而 且 连 机 咒 码 都 相同 。 
然而 ， 因 为 在 CM3 中 ， 异 常 处 理 模型 已 经 “ 洗 心 革 面 ”了 ， 就 故意 把 该 指令 也 重 命名 ， 
以 强调 它 是 在 新 生 的 系统 中 使 用 的 。 并 且 让 程序 员 在 把 ARM7 代码 移植 到 CM3 时 , 能 
分 注意 到 这 个 本 质 的 不 同 《〈《 至 少 必 须 得 改名 ， 每 次 改名 时 都 得 到 和 警示 )。 
由 CM3 的 中 断 优 先 级 模型 可 知 , 我 们 不 能 在 SVC 服务 例 程 中 髓 套 使 用 SVC 指令 (事实 上 这 样 做 
也 没 意 义 )， 因 为 同 优先 级 的 异常 不 能 抢占 自身 。 这 种 作法 会 产生 一 个 用 法 fault。 同 理 ， 在 NMI 
服务 例 程 中 也 不 得 使 用 SVC， 和 否则 将 触发 硬 fault。 












































另 一 个 相关 的 异 稍 是 PendSV《〈 可 其 起 的 系统 调用 )， 它 和 SVC 协同 使 用 。 一 方面 ，SVC 异常 是 
必须 在 执行 SVC 指令 后 立即 得 到 响应 的 《对 于 SVC 异常 来 说 ， 若 因 优 先 级 不 比 当 前 正 处 理 的 高 ， 或 
是 其 它 原因 使 之 无 法 立即 响应 ， 将 上 访 成 硬 fault 一 一 译 者 注 )， 应 用 程序 执行 SVC 时 都 是 希望 所 
需 的 请 求 立即 得 到 啊 应 。 另 一 方面 ，PendSVv 则 不 同 ， 它 是 可 以 像 普通 的 中 断 一 样 被 晤 起 的 〈 不 像 
SVC 那样 会 上 访 )。0S 可 以 利用 它 “ 绥 期 执行 ”一 个 异常 一 一 直到 其 它 重要 的 任务 完成 后 才 执 行动 
作 。 悬 起 PendSV 的 方法 是 : 手工 往 NVIC 的 PendSV 县 起 寄存 器 中 写 1。 悬 起 后 ， 如 果 优 先 级 不 够 
高 ， 则 将 组 期 等 待 执行 。 

PendSV 的 典型 使 用 场合 是 在 上 下 文 切换 时 《在 不 同 任务 之 间 切 换 )。 例 如 ， 一 个 系统 中 有 两 个 
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束 绪 的 任务 ， 上 下 文 切换 被 触发 的 场合 可 以 是 : 

@ 执行 一 个 系统 调用 

@ 系统 滴答 定时 器 〈SYSTICK) 中 断 ， (轮转 调度 中 需要 ) 

让 我 们 举 个 简单 的 例子 来 辅助 理解 。 假 设 有 这 么 一 个 系统 ， 里 面 有 两 个 就 绪 的 任务 ， 并 且 通 过 
SysTick 民间 月 动 上 下 文 切换 。 如 图 7.15 所 示 。 









优先 级 
上 下 文 切换 上 下 文 切 换 上 下 文 切换 


| 
| 
| 
| 
| 
| 
| 
| 


SYSTICK 


| | 
| | 
| | 
| | 
IRQ | 
| | 
| | 
| | 
] 


| | | | | 











Thread 


时 间 


7.15 两 个 任务 间 通 过 SysTick 进行 轮转 调度 的 简单 模式 


上 图 是 两 个 任务 轮转 调度 的 示意 图 。 但 知 在 产生 SysTick 异常 时 正在 啊 应 一 个 中 断 ， 则 
SysTick 异常 会 抢占 其 ISR。 在 这 种 情况 下 ，0S 是 不 能 执行 上 下 文 切换 的 ， 否则 将 使 中 断 请 求 被 延 
迟 ， 而 且 在 真实 系统 中 延迟 时 间 还 往往 不 可 预知 一 一 任何 有 一 丁点 实时 要 求 的 系统 都 决 不 能 容忍 这 
种 事 。 因 此 ， 在 CM3 中 也 是 严禁 没商量 一 一 如 果 0S 在 某 中 断 活 跃 时 尝试 切入 线程 模式 ， 将 触犯 用 
法 fault 异常 。 


























用 法 fault : 在 中 断 活跃 时 企图 回 到 线程 状态 







上 下 文 切换 上 下 文 切换 


fos) 
| | 
| 
| 
| 
| 
| 


IRQ 


‘ | 











Thread 





时 间 
中 断 处 理 被 耽误 


7.16 发 生 IRQ 时 上 下 文 切 换 的 问题 

为 解决 此 问题 ， 早 期 的 0S 大 多 会 检测 当前 是 否 有 中 断 在 活跃 中 ， 只 有 在 无 任何 中 断 需 要 啊 应 
时 ， 才 执行 上 下 文 切 换 (切换 期 间 无 法 响应 中 断 )。 然 而 ， 这 种 方法 的 次 端 在 于 ， 它 可 以 把 任务 切 
换 动作 拖延 很 义 〈 因 为 如 果 抢 占 了 IRQ， 则 本 次 SysTick 在 执行 后 不 得 作 上 下 文 切换 ， 只 能 等 得 下 
一 次 SysTick 异常 ), 尤其 是 当 某 中 断 源 的 频率 和 SysTick 异常 的 频率 比较 接近 时 ,会 发 生 “ 共 振 ”， 
使 上 下 文 切换 迟 迟 不 能 进行 。 

现在 好 了 ，PendSV 来 完美 解决 这 个 问题 了 。PendSsV 异常 会 自动 延迟 上 下 文 切换 的 请 求 ， 直 到 
其 它 的 ISR 都 完成 了 处 理 后 才 放 行 。 为 实现 这 个 机 制 ， 需 要 把 PendSsV 编程 为 最 低 优 先 级 的 措 第 。 























126 


Cortex-M3 权威 指南 第 7 章 





如 果 0s 检测 到 某 IRQ 正在 活动 并 且 被 SysTick 抢占 ， 它 将 上 其 起 一 个 PendsyV 异常 ， 以 便 缓 期 执行 
上 下 文 切换 。 如 图 7.17 所 示 


优先 级 









SYSTICK 


中 断 


SVC 和 
PendSV 


线程 


sysTick (OS) 
[7] 
pn 
ISR 开 始 执行 “1 [6] “IsR 继 续 执行 


人 ED [9] IsR 执 行 完毕 


| 


SVC(OS) 待 决 在 PendSV 中 | 在 Pendsv 中 
一 个 pendSV [2] 执行 上 下 文 切换 1[5] 中 断 发 生 1 执行 上 下 文 切换 
(7) 全 畏 
[3] ， [4] [10] 

1 

















时 间 
7.17 使 用 PendSV 控制 上 下 文 切换 


个 中 事件 的 流水 账 记录 如 下 : 


\O O00 J OU UW NDP- 


10 . 





任务 A 呼叫 SVC 来 请 求 任 务 切换 例如， 等 待 某 些 工 作 完成 ) 

0S 接收 到 请 求 ， 做 好 上 下 文 切 换 的 准备 ， 并 且 悬 起 一 个 PendSsV 异常 。 

当 CPU 退出 SVC 后 ， 它 立即 进入 PendSV， 从 而 执行 上 下 文 切换 。 

当 PendSV 执行 完毕 后 ， 将 返回 到 任务 B， 同 时 进入 线程 模式 。 

发 生 了 一 个 中 断 ， 并 且 中 断 服 务 程序 开始 执行 

在 ISR 执行 过 程 中 ， 发 生 SysTick 异常 ， 并 且 抢占 了 该 ISR。 

0S 执行 必要 的 操作 ， 然 后 悬 起 PendSsV 异常 以 作 好 上 下 文 切换 的 准备 。 

当 SysTick 退出 后 ， 回 到 先前 被 抢占 的 ISR 中 ，ISR 继续 执行 

ISR 执行 完毕 并 退出 后 ，PendSsV 服务 例 程 开 始 执行 ， 并 且 在 里 面 执行 上 下 文 切 换 
当 PendSV 执行 完毕 后 ， 回 到 任务 A， 同 时 系统 再 次 进入 线程 模式 。 
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NVIC 与 中 断 控制 


NVIC 概览 

中 断 配置 基础 

中 断 使 能 与 除 能 

中 断 的 基 起 与 解 甚 

中 断 建 立 全 过 程 的 演示 
软件 中 靳 

再 论 SysTick 定时 器 


8.1 NVIC 概览 








正如 前 文 已 经 多 次 提 到 的 ， 回 量 中 断 控 制 左 ， 价 称 NVIC， 是 Cortex-M3 不 可 分 离 的 一 部 分 ， 
它 与 CM3 内 核 的 逻辑 紧密 精 合 ， -部 分 甚至 水 乳 交 融 在 一 起 。NVIC 与 CM3 内 核 同 声 相 应 ， 同 气 
相 求 ， 相 辅 相 成 ， 里 应 外 合 ， 共 同 完成 对 中 断 的 啊 应 。NVIC 的 寄存 器 以 存储 器 映射 的 方式 来 访问 ， 
除了 包含 控制 寄存 器 和 中 断 处 理 的 控制 多 辑 之 外 ,NVIC 还 包含 了 MPU、SysTick 定时 器 以 及 调试 控 
制 相关 的 寄存 上 器。 本章 中 ， 我 们 将 体检 NVIC 的 中 断 处 理 控制 逻辑 。MPU 与 调试 控制 逻辑 在 后 续 章 
节 中 讨论 。 

NVIC 共 支 持 1 至 246 个 外 部 中 断 输 入 《通常 外 部 中 断 写 作 IRQs)。 具 体 的 数值 由 芯片 厂商 在 
设计 蕊 厂 时 决定 。 此 外 ，NVIC 还 文 持 一 个 “永垂不朽 ”的 不 可 屏蔽 中 断 CNMI) 输入 。NMI 的 实际 
功能 亦 由 心 片 制造 商 雇 定 。 在 某 些 情况 下 ，NMI 无 法 由 外 部 中 断 源 控制 。 

NVIC 的 访问 地 址 是 exE666_E666。. 有 用 NVIC 的 中 断 控 制 /状态 寄存 器 都 只 能 在 特权 级 下 访问 。 
不 过 有 一 个 例外 一 一 软件 触发 中 断 寄存 器 可 以 在 用 户 级 下 访问 以 产生 软件 中 断 。 所 有 的 中 断 控制 / 
状态 寄存 器 均 可 按 字 / 半 字 / 字 节 的 方式 访问 。 此 外 ， 还 有 几 个 中 断 掩 蔽 寄存 器 也 与 中 断 控 制 密切 
相关 ， 它 们 是 第 三 章 中 讲 到 的 “特殊 功能 寄存 器 ”， 只 能 通过 MRS/MSR 及 CPS 来 访问 。 


8.2 中断 配置 基础 


每 个 外 部 中 断 都 在 NVIC 的 下 列 寄存 器 中 “挂号 ”: 
使 能 与 除 能 寄存 器 
巧 起 与 “ 解 晤 ”寄存 需 
优先 级 寄存 央 
@ 活动 状态 寄存 器 
另外 ， 下 列 寄 存 器 也 对 中 断 处 理 有 重大 影响 
@ 异常 手 蔽 寄存 器 (PRIMASK，FAULTMASK 以 及 BASEPRI) 
@ 问 量 表 侦 移 量 寄存 央 
@ 软件 触发 中 断 寄存 右 
@ 优先 级 分 组 位 段 
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8.3 “中断 的 使 能 与 除 能 


中 汤 的 使 能 与 除 能 分 别 使 用 各 目的 寄存 右 来 控制 一 一 这 与 传统 的 ， 使 用 单一 比特 的 两 个 状态 来 
表达 使 能 与 除 能 是 不 同 的 。CM3 中 可 以 有 248 对 使 能 位 / 除 能 位 (SETENA 位 /CLRENA 位 )， 每 个 中 
浙 拥 有 一 对 。 这 246 个 对 子 分 布 在 8 对 32 位 寄存 器 中 (最 后 一 对 没有 用 完 )。 售 使 能 一 个 中 断 ， 我 
们 需要 写 1 到 对 应 SETENA 的 位 中 ; 欲 除 能 一 个 中 断 ， 你 需要 写 1 到 对 应 的 CLRENA 位 中 。 如 果 往 
它们 中 写 6， 则 不 会 有 任何 效果 。 写 零 无 效 是 个 很 关键 的 设计 理念 : 通过 这 种 方式 ， 使 能 / 除 能 中 
断 时 只 需 把 “ 当 事 位 ”写成 1， 其 它 的 位 可 以 全 部 为 零 。 再 也 不 用 像 以 前 那样 ， 害 怕 有 些 位 被 写 入 
6 而 人 破坏 其 对 应 的 中 断 设置 (反正 现在 写 8 没有 效果 了 )， 从 而 实现 每 个 中 汤 都 可 以 日 顾 地 设置 ， 而 
互 不 侵犯 一 一 只 需 单 一 的 写 指令 ， 不 再 需要 读 - 改 - 写 三 步 曲 。 

如 上 所 述 ，SETENA 位 和 CLRENA 位 可 以 有 248 对 ， 对 应 的 32 位 寄存 器 可 以 有 8 对 ， 因 此 使 用 
数字 后 级 来 区 分 这 些 寄存 器 ， 如 SETENA@，SETENA1..SETENA7， 如 表 8.1 所 示 。 但 是 在 特定 的 芯 
片 中 ， 只 有 该 心 厂 实现 的 中 断 ， 其 对 应 的 位 才 有 意义 。 因 些 ， 如 果 某 个 心 厂 文 持 32 个 中 断 ， 则 只 
有 SETENA6/CLRENA6 才 和 需要 使 用 。SETENA/CLRENA 可 以 按 字 / 半 字 / 字 节 的 方式 来 访问 。 义 因为 前 
16 个 异常 已 经 分 配给 系统 异常 ， 故 而 中 断 8 的 异常 号 是 16,， (回顾 第 7 章 中 的 表 7.2) 


表 81 SETENA/CLRENA 寄存 器 族 (此 表 参 考官 方 技 术 参 考 手 册 作 了 些 改 编 一 一 详 者 注 ) 
























































SETENASs: xEQ00_ E100 - OxEO000 El1lC ; CLRENAs:O0xEOO0O0E180 - OxEO000_E19C 


Re es 中 断 32-63 的 使 能 寄存 器 ， 共 32 个 使 能 位 
[| 中 汤 224-239 的 使 能 寄存 器 ， 共 16 个 使 能 位 


CLRENA1 6xE666 E184 Lu 中 断 32-63 的 除 能 寄存 器 ， 共 32 个 除 能 位 


CLRENA7 | RN | exE666_E19C | 6 中断 224-239 的 除 能 寄存 器 ， 共 16 个 除 能 位 
8.4 ”中 断 的 悬 起 与 解 旦 


如 果 中 断 发 生 时 ， 正 在 处 理 同 级 或 高 优先 级 异常 ， 或 者 被 手 责 ， 则 中 断 不 能 立即 得 到 啊 应 。 此 
时 中 断 被 悬 起。 中 断 的 县 起 状态 可 以 通过 “中 断 设置 县 起 寄存 器 (SETPEND) ”和 “中 断 且 起 清除 寄 
存 右 (CLRPEND)” 来 谈 取 ， 还 可 以 写 它 们 来 手工 其 起 中 断 。 

芒 起 寄存 器 和 “ 解 惹 ” 突 存 器 也 可 以 有 8 对 ， 其 用 法 和 用 量 都 与 表面 介绍 的 使 能 / 除 能 寄存 器 
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完全 相同 ， 见 表 8. 2。 
表 8.2 SETPEND/CLRPEND 寄存 器 族 〈 此 表 参 考官 方 技术 参考 手册 作 了 些 改编 一 一 译 者 注 ) 


SETPENDSs:OXxE000_E200 - 0XE000_E21C ; CLRPENDS:UxE000E280 - 0XE000_E29( 


SETPEND1 6xE666 E264 fe 中 断 32-63 的 悬 起 寄存 器 ， 共 32 个 悬 起 位 


SETPEND7 6xE666 E21C re 中 断 224-239 的 悬 起 寄存 器 ， 共 16 个 悬 起 位 


CLRPEND1 89xE666 E284 -| 中 断 32-63 的 解 悬 寄存 器 ， 共 32 个 解 悬 位 


CLRPEND7 | R/W | 6xE666_E29C | 6 | 中断 224-239 的 解 悬 寄存 器 ， 共 16 个 解 悬 位 
8.4.1 优先 级 


每 个 外 部 中 断 都 有 一 个 对 应 的 优先 级 寄存 硕 ， 每 个 宥 存 融 占用 8 位 ， 但 是 CM3 允许 在 最 “ 粗 线 
条 ”的 情况 下 ， 只 使 用 最 高 3 位 。4 个 相 临 的 优先 级 寄存 器 拼 成 一 个 32 位 寄存 器 。 如 前 所 述 ， 根 据 
优先 级 组 的 设置 ， 优 先 级 可 以 被 分 为 高 低 两 个 位 段 ， 分 别 是 抢占 优先 级 和 亚 优 先 级 。 优 先 级 寄存 器 
都 可 以 按 字 和 访问 ， 当 然 也 可 以 投 半 学 / 孚 来 访问 。 有 意义 的 优先 级 寄存 器 数目 由 民 片 广 商 实现 的 
中 断 数目 决定 ， 优 移 级 配置 寄存 堪 的 详细 信息 在 附录 D 中 给 出 ( 表 D.18)。 


表 8.3 “中断 优先 级 寄存 器 阵列 OxE000 E400 - OxE000 E4EF 
RAW \ 

外 中 断 # 的 优先 级 

Ee 








PRI_239 | R/W | 9xE689_E4EF | 8 《8 位 ) | 外 中 断 #239 的 优先 级 
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表 8.3B ”系统 异常 优先 级 寄存 器 阵列 OxE000 ED18 - OxE000 ED23 


CIEE EE EE ET 


9xE@e8_ED1A 

| axFeaaREDIR | RE | | = 
| | 

exEoee ED -  - -  - 


| | 
‘exEe09 EDIF PRFII1 Sv 人 Mj 级 


QxEee0_ED20 l= 
exEeee E02 
| | | 
‘exEe99 ED23 PRI15 | | JSysTick 的 估 先 级 


8.4.2 ”活动 状态 


每 个 外 部 中 断 都 有 一 个 活动 状态 位 。 在 处 理 右 执行 了 其 ISR 的 第 一 条 指令 后 ， 它 的 活动 位 束 被 
置 1， 并 且 直 到 ISR 返回 时 才 便 件 清 零 。 由 于 文 持 舱 套 ， 人 允许 局 优先 级 异 关 抢占 某 个 ISR。 然 而 ， 
哪 介 中 断 被 抢占 ， 其 活动 状态 也 依然 为 1〈 请 仔细 琢磨 前 文 讲 到 的 “直到 ISR 返回 时 才 清 零 )。 活 动 
状态 寄存 融 的 定义 ， 与 前 面 讲 的 使 能 / 除 能 和 悬 起 / 解 悬 寄存 亏 相 同 ， 上 只 是 不 再 成 对 出 现 。 和 它们 也 能 
按 字 / 半 字 /他 市 访问 ， 但 他 们 是 只 读 的 ， 如 表 8.4 所 示 。 


表 8.4 ACTIVE 寄 仔 器 族 ”0xE000_E300_0xE000_E31C (此 表 参 考官 方 技 术 参 考 手册 作 了 些 改编 一 一 




















详 者 注 ) 


Ea 


ACTIVE1 9xE666 E364 中 断 32-63 的 活动 状态 寄存 器 ， 共 32 个 状 
态 位 
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ACTIVE7 9XxE666 E31C 中 汤 224-239 的 活动 状态 寄存 堪 ， 共 16 个 
状态 位 





8.4.3 ”特殊 功能 寄存 器 PRIMASK 与 FAULTMASK 


PRIMASK 用 于 除 能 在 NMI 和 便 fault 之 外 的 所 有 异常 ， 它 有 效 地 把 当前 优先 级 改 为 86 (可 编程 
优先 级 中 的 最 高 优先 级 )。 该 寄存 器 可 以 通过 MRS 和 MSR 以 下 例 方式 访问 : 














1. 关中 断 
MOV RO, #1 
MSR PRIMASK, RO 
2. 开 中 汤 
MOV RO, #0 
MSR PRIMASK, RO 
此 外 ， 还 可 以 通过 CPSs 指 令 快 速 完 成 上 述 功能 : 
GPESTD 半 ; 天 中 朵 
GESTR 4 ; 开 中 新 


FAULTMASK 更 绝 ， 它 把 当前 优先 级 改 为 -1。 这 么 一 来 ， 连 便 fault 都 被 掩蔽 了 。 使 用 方案 与 
PRIMASK 的 相似 。 但 要 注意 的 是 ，FAULTMASK 会 在 异常 退出 时 自动 清 零 。 

手 蔽 寄存 器 虽然 能 一 手 庶 天， 却 都 动 不 了 NMI， 因 为 NMI 是 用 在 最 危急 的 情况 下 的 。 因 此 系统 为 
它 开 出 单行 道 ， 无 需 挂 号 只 是 不 要 迟到 。 当 NMI 激 活 时 ,“ 谁 都 是 省 略 号 ， 唯 独 是 你 不 得 了 ， 第 一 优 
先 谁 比 你 重要 ”! 试想 ， 如 果 NMI 被 连接 到 系统 的 抒 电 报警 线 上 ， 且 系统 是 体外 循环 机 的 电源 管理 
器 …… 如 果 因 为 中 断 被 除 能 就 视而不见 ， 则 会 使 体外 循环 机 因 断 电 而 失 能 ， 体 外 循环 序列 可 以 被 意 
外 终止 ， 病 人 的 生命 也 将 丢失 。 


8.4.4 ”BASEPRI 寄存 器 


在 更 精巧 的 设计 中 ， 需 要 对 中 断 撞 责 进行 更 细 腊 的 控制 一 一 只 掩 向 优先 级 低 于 茶 一 国 值 的 中 断 
一 一 它们 的 优先 级 在 数字 上 大 于 等 于 某 个 数 。 那 么 这 个 数 存储 在 哪里 ? 就 存储 在 BASEPRI 中 。 不 过 ， 
如 果 往 BASEPRI 中 写 6， 则 男 当 别论 一 一 BASEPRI 将 停止 掩蔽 任何 中 断 。 例 如 ， 如 果 我 们 需要 掩蔽 所 
有 优先 级 不 高 于 9x66 的 中 断 ， 则 可 以 如 下 编程 : 

MOV RO, #0x60 

MSR BASEPRI, RO 
如 果 需 要 取消 BASEPRI 对 中 断 的 掩蔽 ， 则 示例 代码 如 下 : 

MOV RO, #0 

MSR BASEPRI, RO 

男 外 ， 我 们 还 可 以 使 用 BASEPRI_MAX 这 个 名 凶 来 访问 BASEPRI 否 和 存 占 ， 它 俩 其 实 是 同一 个 寄存 
器 。 但 是 当 我 们 使 用 这 个 名 字 时 ， 会 使 用 一 个 条 件 写 操作 。 个 中 原因 如 下 : 尽管 它 俩 在 便 件 水 平 上 
是 同一 个 寄存 器 ， 但 是 生成 的 机 器 人 码 不 一 样 ， 从 而 便 件 的 行为 也 不 同 : 使 用 BASEPRI 时 ， 可 以 任意 
设置 狐 的 优先 级 贱 值 ， 但 是 使 用 BASEPRI_MAX 时 则 “ 许 进 不 许 出 ”一 一 只 允许 新 的 优先 级 阔 值 比 原 
来 的 那个 在 数值 上 更 小 ， 也 就 是 说 ， 只 能 一 次 次 地 扩大 掩蔽 范围 ， 反 之 则 不 行 。 就 好 像 强 子 打 了 死 
结 ， 只 会 越 拉 越 紧 。 举 例 来 说 ， 检 视 下 面 的 程序 厂 断 : 



































MOYV RO, #0x60 
MSR BASEPRI_ MAX, RO ;掩蔽 优先 级 不 高 于 0x60 的 中 断 
MOV iad #0x£0 
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MSR BASEPRI_ MAX, RO ; 本 次 设置 被 忽略 ， 因 为 0xf0 比 0x60 的 优先 级 低 

MOV RO, #0x40 

MSR BASEPRI_ MAX, RO ;OK。 扩 大 手 届 范围 到 优先 级 不 高 于 0x40 的 中 晰 

为 了 把 担 珊 几 值 降低 ， 或 者 解除 手 菩 ， 需 要 使 用 “BASEPRI” 这 个 名 字 。 上 例 中 ， 把 设置 阀 值 
为 6xfe 的 那 条 指令 改 用 BASEPRI， 则 可 以 操作 成 功 。 显 然 ， 在 用 户 级 下 是 不 得 更 改 BASEPRI 寄 存 器 
的 。 与 其 它 和 优先 级 有 关 的 寄存 器 一 样 ， 系 统 中 表达 优先 级 的 位 数 ， 也 同样 影响 BASEPRI 中 有 意义 
的 位 数 。 如 果 系 统 中 只 使 用 3 个 位 来 表达 优先 级 ， 则 BASEPRI 有 意义 的 值 仅 为 9x866，6x26，68x46， 
9Xx686，6Xx86，686XxA6，6xC8 以 及 9XE6。 


8.4.5 “其它 异 前 的 配置 寄存 器 


用 法 fault， 总 线 fault 以 及 存储 器 管理 fault 都 是 特殊 的 异常 ， 因 此 给 它们 开 了 小 灶 。 其 中 ， 
它们 的 使 能 控制 是 通过 “系统 Handler 控 制 及 状态 寄存 器 (SHCSR)”( 地 址 : 6xE666_ED24) 来 实现 
的 。 各 种 faults 的 葵 起 状态 和 大 多 数 系统 异常 的 活动 状态 也 都 在 该 寄存 器 中 ， 如 表 8.5 所 示 。 


表 8.5 系统 Handler 控 制 及 状态 寄存 器 SHCSR ( 地 址 : 0xE000_ED24 ) 


位 自 类 型 
RN 用 法 fault 服务 例 程 使 能 位 

总 线 fault 服务 例 程 使 能 位 

存储 器 管理 fault 服务 例 程 使 能 位 


R/W SVC 悬 起 中 。 本 来 已 经 要 SVC 服务 例 程 ， 但 


是 却 被 更 高 优先 级 异常 取代 
R/W 总 线 fault 悬 起 中 ， 细 节 同 上 。 
MEMFAULTPENDED | R/W 


存储 器 管理 fault 县 起 中 ， 细 节 同 上 
USGFAULTPENDED 


用 法 fault 县 起 中 ， 细 节 同 上 
1 / sysTick 开放 





























SVC 开间 活动 中 
用 法 fault 异常 活动 中 
总 线 fault 异常 活动 中 
存储 器 管理 fault 异常 活动 中 
写 这 些 寄存 器 时 要 小 心 , 必须 确 你 对 活动 位 的 修改 是 经 过 深思 台 虑 的 , 决 不 能 粗心 修改 。 盏 则 ， 
如 果 东 个 天 利 的 活动 位 被 意外 地 清 零 了 ， 其 服务 例 程 却 不 知晓 ， 仍 然 执 行 异 种 返回 指令 ， 那 么 CM3 
将 视 之 为 无 理 取 闲 一 一 在 异常 服务 例 程 以 外 做 异 第 返回 ， 从 而 产生 一 个 fault。 


ey 
/mn 
a 





Cs 
| 
hk 
yd 
| 
ss 
Ea 
RIW “6@ PendsV 异常 活动 中 
= | 
= 
om] 
Eo 
| 
-=| 
| 
| 








译注 : 下 段 文字 改编 自 《Cortex-M3 Technical Reference Manual》, pg8-29， 是 给 那些 骨灰 级 玩家 们 看 的 ， 因 为 修改 这 
些 位 还 有 更 深层 次 的 背景 和 特效 。 详 文 为 : 上 表 中 的 活动 位 虽然 也 是 可 写 的 ， 但 是 改动 时 必须 予以 极度 的 小 心 ， 否 
则 这 是 玩 火 行 为 一 一 设置 或 者 清 零 这 些 位 , 会 改变 处 理 器 中 对 异 第 活动 的 记录 , 却 不 会 对 应 地 修复 堆栈 中 的 数据 (不 
会 为 了 此 改动 而 特意 执行 一 次 自动 入 栈 或 自动 出 栈 操作 )， 于 是 埋 下 了 破坏 堆栈 内 容 而 引起 程序 跑 改 的 隐患 另外， 
其 它 一 些 重 要 的 数据 结构 也 得 不 到 清除 ， 后 患 无 穷 。 事 实 上 ， 只 有 操作 系统 在 特殊 场合 下 才 会 修改 它们 。 例 如 : 在 
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任务 执行 系统 调用 的 过 程 中 执行 上 下 文 切 换 (大 幅 提 升 实时 性 ), 或 者 在 使 用 软件 模拟 未 定义 指令 的 功能 期 间 (在 用 
法 fault 服 务 例 程 中 )， 以 及 软件 模拟 协 处 理 器 的 功能 期 间 ， 执 行 上 下 文 切 换 ， 同 样 大 幅 提 升 实时 性 。 

下 面 开 始 讲 中 断 控 制 及 状态 寄存 器 ICSR。 对 于 NMI、SysTick 定 时 器 以 及 PendSV， 可 以 通过 此 寄存 器 手工 县 起 它 
们 。 另 外 ， 在 该 寄存 器 中 ， 有 好 多 位 段 都 用 于 调试 目的 。 在 大 多 数 情况 下 ， 它 们 对 于 应 用 软件 都 没有 什么 用 处 ， 只 
有 悬 起 位 对 应 用 程序 常常 比较 有 参考 价值 ， 如 表 8.6 所 示 。 


表 8.5 ”中 断 控制 及 状态 寄存 器 ICSR ( 地 址 : 0xE000_ED04 ) 


| 位 及 = 名称 >= 关东 国 | 各 位 信 中 | 


状态 


EC 写 1 以 悬 起 SysTick。 读 取 它 则 返回 PendSsyV 的 
状态 

ISRPREEMPT =1 时 ， 则 表示 一 个 基 起 的 中 断 将 在 下 一 步 时 进 
入 活动 状态 〈 用 于 单 步 执 行 时 的 调试 目的 ) 

















ES 12 VECTPENDING 悬 起 的 ISR 的 编号 。 如 果 不 止 一 个 中 断 悬 起 ， 








VECTACTIVE 当前 活动 的 ISR 编 号 ， 该 位 段 指出 当前 运行 中 的 
ISR 是 哪个 中 断 的 〈 提 供 异 常 序 号 )， 包 括 NMI 和 
全 fault。 如 果 多 个 异常 共享 一 个 服务 例 程 ， 该 例 程 可 
根据 本 位 段 的 值 来 判定 是 哪 一 个 异常 的 响应 导致 它 的 执 
行 。 把 本 位 段 的 值 减 去 16, 就 得 到 了 外 中 断 的 编号 ， 并 
可 以 用 此 编号 来 操作 外 中 断 相 关 的 使 能 / 除 能 等 寄存 器 。 


8.5 ”中 断 系统 设置 全 过 程 的 演示 


下 面 给 出 一 个 简单 的 例子 ， 以 演示 如 何 建立 一 个 外 部 中 断 。 

1. 当 系 统 司 动 后 ， 移 设置 优先 级 组 寄存 句 。 缺 省 情况 下 使 用 组 8〈7 位 抢占 优先 级 ，1 位 亚 优 
完 级 )。 

2. 如 果 需 要 重 定位 向 量 表 , 先 把 硬 fault 和 NMI 服 务 例 程 的 入 口 地 址 写 到 新 表 项 所 在 的 地 址 中 。 

3. 配置 向 量 表 依 移 量 寄存 肯 ， 使 之 指 问 狐 的 问 量 表 (如 末 有 恒定 位 的 话 ) 

4. 为 该 中 断 建 并 中 断 问 量 。 因 为 向 量 表 可 能 已 经 重 定位 了 ， 保 险 起 见 需 要 先 读 取 问 量 表 偏 移 
量 寄 存 亏 的 值 ， 再 根据 该 中 断 在 表 中 的 位 置 ， 计 复出 对 应 的 表 项 ， 再 把 服务 例 程 的 入 口 地 址 填写 进 
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去 。 如 朱 一 直 使 用 ROM 中 的 回 量 表 ， 则 无 需 此 步骤 。 





应 用 程序 中 断 及 复位 控制 寄存 吉 
使 用 优先 级 组 5 (2/6) 


; 设置 优先 级 组 





ROM 中 的 问 量 表 


读 取 NMI 和 硬 fault 的 向 量 


5. 为 该 中 断 设 置 优先 级 。 

6. 使 能 该 中 断 

示例 汇编 代码 如 下 : 

LDR RO, =0xEOO0OEDOC ; 
LDR R1, =0x0S5FAOSOO > 

STR Rl [RO] 

MOYV R4, #8 / 
LDR RD, = (NEW_VECT_TABLE+8) 
LDMIA R41!, {RO—R1} je 
STMTA RS5!; {RO—R1} > 


着 家 RO, 
I RT 
STR RT 
DR RO, 
LDR R1, 
下 局 太 RL, 
ADD R1, 
STR RO, 
LDR RO, 
MOV RL; 
STRB R1, 
LDR RO, 
MOV RT 
STR R1, 


=0xEO0O0O0EDO8 : 
=NEW_VECT_TABLE 


[RO] ; 


=IRO7_ Handler ， 
=0xEO0O00EDO8 > 
[R1] 

R1,#(4*(7+16)); 


[Ri1] ; 


=0xEOOOE400 > 
#0xCO 


[RO, #7] > 


=0xEOOOE100 > 
人 施放 疙 了 > 
[RO] ; 


捞 贝 它们 的 问 量 到 新 表 中 








癌 量 表 仿 移 量 寄存 右 的 地 址 








把 问 量 表 重 定位 





取得 IRQ #7 服务 例 程 的 入 口 地 址 
问 量 表 侦 移 量 寄存 器 的 地 址 





计算 IRQ #7 服务 例 程 的 入 口 地 址 

在 向 量 表 中 写 入 IRQ #7 服务 例 程 的 入 口 地 址 
外 部 中 断 优先 级 寄存 绒 阵 列 的 基地 址 

把 IRQ #7 的 优先 级 设置 为 0xC0 
SETEN 和 寄存 器 的 地 址 


置 位 IRO #7 的 使 能 位 
使 能 IRO #7 








波 





另外 ， 如 果 优 先 级 组 的 设置 使 得 中 断 坟 套 层次 可 以 很 深 ， 则 务 请 确认 主 堆栈 的 容量 足够 用 。 因 
为 异常 服务 程序 总 是 使 用 MsP， 为 安全 起 见 ， 主 堆栈 的 容量 应 是 最 大 可 能 需求 的 量 〈 嵌 套 最 深 时 需 





要 的 量 )。 











如 果 应 用 程序 储存 在 ROM 中 ， 并 且 不 需要 改变 异 各 服务 程 序 ， 则 我 们 可 以 把 整个 癌 量 表 编 码 到 


ROM 的 起 始 区 域 〈 从 8 地 址 开始 的 那 段 )。 
一 直 在 ROM 中 ， 因 此 上 例 可 以 大 大 简化 ， 
建立 优先 级 组 


1 
2 
3. 





为 该 中 断 指 定 优先 级 


使 能 该 中 断 
如 下 在 I/0 密 集 型 系统 中 ， 软 件 需 要 控制 大 量 的 健 件 设备 ， 则 可 能 必须 要 考虑 如 下 因素 : 





该 心 片 文 持 的 中 断 数 
该 心 片 中 表达 优先 级 的 位 数 




















在 这 种 情况 下 ， 问 量 表 的 偶 移 量 将 一 二 为 6, 并 且 中 断 问 量 


只 需 3 步 : 
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在 CM3 的 NVIC 中 ， 有 一 个 名 为 “中 断 控制 器 类 型 寄存 器 ”， 它 提供 了 该 必 片 中 文 持 的 中 断 数目 ， 
粒度 是 32 的 整数 倍 ,〈 如 表 8.7 所 示 )。 如 果 你 嫌 它 太 粗 核 大 时 ， 也 可 以 通过 对 每 个 SETENA 位 进行 先 
写 后 读 的 测试 ， 来 获取 文 持 的 中 断 的 精确 数目 ( 往 各 SETENA 中 写 1， 不 支持 的 中 断 将 永远 读 回 8， 求 
出 第 1 个 8 的 位 置 即 可 ), 亦 可 使 用 SETPEND 等 其 它 位 来 做 此 测试 。 这 主要 用 于 需要 适应 不 同 蕊 片 的 程 
序 。 如 果 已 经 确定 使 用 固定 的 蕊 厂 ， 则 无 需 多 此 一 淮 。 

















表 8.7 ”中 断 控制 器 类 型 寄 仓 器 ICTR ( 地 址 : 0xE000_E004 ) 


位 名 称 类 复 描述 
段 型 位 
值 
4:6 INTLINESUM R - 中 上 断 输入 的 数量 ， 以 32 为 粒度 ， 如 
6=1 全 32 
1=33 全 64 
2=65 至 96 





为 了 判定 正在 使 用 的 芯片 使 用 了 多 少 位 来 表达 优先 级 ， 也 可 使 用 类 似 的 方法 : 往 某 个 优先 级 寄 
存 右 中 写 入 6xFF， 再 读 回 来 。 则 从 MSB 开 始 ， 有 多 少 位 是 1 就 有 多 少 位 表达 优先 级 。 最 少 要 使 用 3 个 
位 ， 此 时 你 读 回 的 是 BxE6。 


8.6 ”软件 中 断 


软件 中 断 ， 包 括 手 工 产 生 的 普通 中 断 ， 能 以 多 种 方式 产生 。 最 简单 的 就 是 使 用 相应 的 SETPEND 
寄存 右 ; 而 更 专业 更 快捷 的 作法 ， 则 是 通过 使 用 软件 触发 中 断 寄 存 右 STIR， 如 表 8.8 所 示 。 


表 8.8 ”软件 触 友 中 断 寄 存 器 STIR ( 地 址 : 0xE000_EF00 ) 




















位 名 称 类 复 描述 
段 型 位 
值 
8:0 INTID W - 影响 编写 为 INTID 的 外 部 中 断 , 其 晤 起 位 


注意 : 系统 异常 CNMI，faults，PendSsVv 等 )， 不 能 用 此 法 悬 起 。 而 且 缺 省 时 根本 不 允许 用 户 
程序 改动 NVIC 寄 存 右 的 值 。 如 果 确 实 需 要 , 必须 先 在 NVIC 的 配置 和 控制 寄存 占 (8xE8868_ED14) 中 ， 
把 比特 1 USERSETMPEND) 置 位 ， 才 能 允许 用 户 级 下 访问 NVIC 的 STIR。 





8.7 SysTick 定时 器 





SysTick 定 时 器 被 捆绑 在 NVIC 中 ， 用 于 产生 sysTick 异 常 ( 异 常 号 ;: 15)。 在 以 前 ， 操 作 系统 
还 有 所 有 使 用 了 时 基 的 系统 ， 都 必须 一 个 便 件 定时 器 来 产生 需要 的 “滴答 ”中 断 ， 作 为 整个 系统 的 
时 基 。 滴 答 中 断 对 操作 系统 尤其 重要 。 例 如 ， 操 作 系 统 可 以 为 多 个 任务 许 以 不 同 数 目的 时 间 上 请， 确 
保 没 有 一 个 任务 能 霸占 系统 ， 或 者 把 每 个 定时 器 周期 的 某 个 时 间 范 围 赐 巴特 定 的 任务 每 ， 还 有 操作 


系统 提供 的 各 种 定时 功能 , 邦 与 这 个 滴答 定时 右 有 大。 因此 , 需要 一 个 定时 亏 来 产生 周期 性 的 中 断 ， 
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而 且 最 好 还 让 用 户 程序 不 能 随意 访问 它 的 寄存 器 ， 以 维持 操作 系统 “心跳 ”的 节律 。 

Cortex-M3 处 理 器 内 部 包含 了 一 个 简单 的 定时 右 。 因 为 所 有 的 CM3 已 片 都 带 有 这 个 定时 器 ， 软 
件 在 不 同 CM3 右 件 间 的 移植 工作 束 得 以 化 人 简 。 该 定时 器 的 时 钟 源 可 以 是 内 部 时 钟 (FCLK，CM3 上 的 
自由 运行 时 钟 )， 或 者 是 外 部 时 钟 〈 CM3 处 理 器 上 的 STCLK 信 号)。 不 过 ，STCLK 的 具体 来 源 则 由 芯 
片 设计 者 决定 ， 因 此 不 同 产品 之 间 的 时 钟 频 率 可 能 会 大 不 相同 。 因 此 ， 需 要 检视 芯片 的 器 件 手册 来 
决定 选择 什么 作为 时 钟 源 。 

SysTick 定 时 器 能 产生 中 汤 ，CM3 为 它 专门 开 出 一 个 异常 类 型 ， 并 且 在 问 量 表 中 有 它 的 一 遍 之 
地 。 它 使 操作 系统 和 其 它 系 统 软件 在 CM3 器 件 间 的 移植 变 得 简单 多 了 ， 因 为 在 所 有 CM3 产 品 间 ， 
SysTick 的 处 理 方式 都 是 相同 的 。 

有 4 个 寄存 器 欣 制 SysTick 定 时 右 ， 如 表 8.9 至 表 8.12 所 示 。 














表 8.9 ”sysTick 控 制 及 状态 寄 仔 器 ( 地 址 : 0xE000_E010 ) 


CLKSOURCE 9= 外 部 时 钟 源 (STCLK ) 
1= 内 核 时 钟 (FCLK) 





日 ENABLE RINW 8 SysTick 定 时 器 的 使 能 位 


表 8.10 ”SysTick 重 滚 载 数 值 寄存 器 ( 地 址 : 0xE000_E014 ) 


表 8.11 SysTick 当 前 数值 寄存 器 ( 地 址 : 0xE000_E018 ) 





表 8.10 sysTick 校 准 数值 寄 仓 器 ( 地 址 : 0xE000_E01C ) 


>KEW 1= 校 准 值 不 是 准确 的 16ms 
一 一 一 一 一 一 一 
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校准 值 寄存 右 提 供 了 这 样 一 个 解决 方案 : 它 使 系统 即使 在 不 同 的 CM3 产 品 上 运行 ， 也 能 产生 恒 
定 的 SysTick 中 断 频 率 。 最 简单 的 作法 吏 是 : 直接 把 TENMS 的 值 写 入 重 闭 载 寄存 器 ， 这 样 一 来 ， 只 
要 没 突破 系统 的 “弹性 极限 ”， 束 能 做 到 每 86ms 来 一 次 SysTick 寞 常 。 如 朵 和 圾 要 其 它 的 SysTick 了 卉 
季 周 期 ， 则 可 以 根据 TENMS 的 值 加 以 比例 计算 。 只 不 过 ， 在 少数 情况 下 ，CM3 心 族 可 能 无 法 准确 地 提 
供 TENMS 的 值 《如 ，CM3 的 校准 输入 信号 被 拉 低 )， 所 以 为 保险 起 匈 ， 最 好 在 使 用 TENMS 前 检 谷 峰 件 
的 参考 手册 。 

SysTick 定 时 亏 除 了 能 服务 于 操作 系统 乙 外 ， 还 能 用 于 其 它 目 的 : 如 作为 一 个 闸 铃 ， 用 于 测量 
时 间 等 。 要 注意 的 是 ， 当 处 理 融 在 调试 期 间 被 喊 停 “halt) 时 ， 则 SysTick 定 时 天 尔 将 暂停 运作 。 
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中 断 的 具体 行为 





中 断 / 寞 常 的 啊 应 序列 
寞 常 运 回 

藤 套 的 中 断 

咬 尾 中 晰 

晚 到 《的 各 优先 级 ) 中断 
异常 返回 值 

中 汤 延 述 

异常 响应 期 间 的 faults 





: 在 本 章 中 ， 如 无 特殊 说 明 ， 不 分 辨 “ 中 断 ” 与 “异常 ”这 两 个 术语 ， 可 以 互 换 使 用 。 


9.1 中断/ 异 弟 的 响应 序 让 


当 CM3 开 始 啊 应 一 个 中 断 时 ， 会 在 它 小 小 的 体内 奔涌 起 三 股 暗 流 : 

@ 入 栈 : 把 8 个 寄存 器 的 值 压 入 栈 

@ 取 问 量 : 从 问 量 表 中 找 出 对 应 的 服务 程序 入 口 地 址 

@ ”选择 堆栈 指针 MSP/PSP， 更 新 堆栈 指针 SP， 更 新 连接 寄存 器 LR， 更 新 程序 计数 器 PC 


9.1.1 人 入 栈 


响应 异常 的 第 一 个 行动 ， 就 是 自动 保存 现场 的 必要 部 分 : 依次 把 xPSR, PC LR, R12 以 及 R3-R0 由 硬 
件 上 自动 压 入 适当 的 堆栈 中 : 如 果 当 啊 应 异 音 时， 当前 的 代码 正在 使 用 PSP， 则 压 入 PSP， 也 残 是 使 用 
进程 堆栈 ， 否 则 就 压 入 MSP， 使 用 主 堆栈 。 一 旦 进入 了 服务 例 程 ， 就 将 一 直 使 用 主 堆栈 。 

假设 入 栈 开 始 时 ，SP 的 值 为 N， 则 在 入 栈 后 ， 扒 栈 内 部 的 变化 如 表 9.1 表 示 。 又 因为 AHB 接 口上 
的 流水 线 操作 本 性 , 地 址 和 数据 都 在 经 过 一 个 流水 线 周 期 之 后 才 进 入 。 另外 , 在 自动 入 栈 的 过 程 中 ， 
把 寄存 器 写 入 堆栈 内 存 的 时 间 顺 序 ， 并 不 是 与 写 入 的 空间 顺序 相对 应 的 。 但 是 机 器 会 保证 : 正确 的 
寄存 器 将 被 保存 到 正确 的 位 置 ， 如 图 9.1 和 表 9.1 的 第 3 列 所 示 。 


更 
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表 9.1 。 入 栈 顺 序 以 及 入 栈 后 堆栈 中 的 内 容 
寄存 器 。 被 保存 的 顺序 


地 址 
入 的 内 容 
pc 
ir 
a 
2 
a 
0 


OW 人 VO ~ oo PN 













es _N-8 | N-4 | N-32 | N-28 | N-24 | N-20 | N-16 | N-12 | 
数据 
(HWDATA) L PC | PSR | Ro | R1 | R2 | Ra | R12 | LR 





时 间 
到 9.1 ”内 部 入 枝 序 询 


Cortex-M3 r2p0 修 订 版 的 区 别 


在 r2p0 中 ， 目 动 打开 了 “ 双 宇 对齐 的 堆栈 工作 模式 ”， 人 简称 双 字 对 齐 模 式 。 在 双 
字 对 齐 的 模式 下 ，SP 的 值 必须 能 被 8 整除 。 如 果 没 有 打开 双 字 对 齐 ， 则 与 图 9.1 和 表 9.1 
所 示 的 相同 。 但 如 果 打 开 了 双 字 对 齐 ， 可 是 SP 却 不 能 被 8 整除 ， 则 没有 对 齐 的 一 个 字 被 
空 出 来 ， 所 有 入 栈 寄存 器 的 地 址 ， 依 序 减 4。 如 : PC 不 再 是 N-8， 而 是 N-12， 其 它 寄存 
妖 亦 如 此 。 

上 文 所 提 到 的 这 个 目 动 压 入 的 8 字数 据 块 ， 通常 补 称 作 “ 异 常 堆栈 帧 (exception 
stack frame) ”。 在 CM3 修 订 版 2 之 前 ， 缺 省 配置 下 的 堆栈 帧 可 以 始 于 任何 字 对 齐 的 地 
址 。 到 了 修订 版 2， 则 改 为 缺 省 配置 下 堆栈 帧 要 双 字 对 齐 。 之 所 以 这 样 做 ， 是 为 了 满足 
AAPCS 所 规定 的 过 程 调用 标准 。 这 个 功能 其 实在 CM3 的 修订 版 1 中 束 有 了 ， 只 是 缺 省 时 
没有 打开 。 如 欲 在 修订 版 1 中 开启 此 功能 ， 需 要 手动 在 NVIC 配 置 控 制 寄存 器 中 置 位 
STKALIGN 位 。 当 需要 除 能 此 特性 时 ， 也 只 需 清除 此 位 。 关 于 该 寄存 器 的 更 多 细节 ， 请 
参阅 第 12 草 〈 双 衬 堆 栈 对 章节 ) 。 
































CM3 在 看 不 见 的 内 部 “ 搅 浑 ”了 入 栈 的 顺序 ,这 是 有 深层 次 的 原因 的 。 先 把 PC 与 XPSR 的 值 保 存 ， 
束 可 以 更 早 地 局 动 服务 例 程 指令 的 预 取 一 一 因为 这 需要 修改 PC; 同时 ， 也 做 到 了 在 早期 束 可 以 更 新 
xPSR 中 IPSR 位 段 的 值 。 

细心 的 读者 一 定 在 猜测 :为 啥 祖 护 RO-R3 以 及 R12 昵 ，R4-R11 就 是 下 等 公民 ? 原来 ， 在 ARM 上 ， 
有 一 套 的 C 函 数 调 用 标准 约定 ( 《C/C++ Procedure Call Standard for the ARM Architecture》 ，AAPCS， 
Ref5) 。 个 中 原因 就 在 它 上 和 面 : 它 使 得 中 断 服 务 例 程 能 用 C 语 言 编写， 编译 器 优先 使 用 入 栈 了 的 寄存 
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器 来 保存 中 间 结 果 “〈 当 然 ， 如 果 程 序 过 大 也 可 能 要 用 到 R4-R11， 此 时 编译 器 负责 生成 代码 来 push 它 
们 。 但 是 ，ISR 应 该 短小 精 悍 ， 不 要 让 系统 如 此 操心 一 一 译 者 注 ) 。 

如 果 读 者 再 仔细 看 ， 会 发 现 RO-R3, R12 是 最 后 被 压 进去 的 。 这 里 也 有 一 番 良 苦 用 心 : 为 的 是 可 以 
更 容易 地 使 用 sP 基 址 来 索引 寻 址 ， (这 也 方便 了 LDM 等 多 重 加 载 指 令 。 因 为 LDM 必 须 加 载 地 址 连续 
的 一 串 数据 , 而 现在 RO-R3, R12 的 存储 地 址 连续 了 一 一 译 者 注 )。 这 种 顺序 也 舒展 了 参数 的 传递 过 程 : 
使 之 可 以 方便 地 通过 读 取 入 栈 了 的 RO-R3 取 出 (主要 为 系统 软件 所 利用 ,多 见于 SVC 与 PendSV 中 的 参 
数 传递 ) 。 


9.1.2 有 取 同 量 


当 数 据 总 线 〈 系 统 恕 线 ) 正在 为 入 栈 操作 而 忙 得 风风火火 时 ， 指 令 忌 线 (1-Code 忆 线 ) 可 不 十 
头 快 地 坐 那儿 看 热 羡 一 一 筷 正 在 为 啊 应 中 断 紧 张 有 序 地 执行 态 一 项 重要 的 任务 : 从 癌 量 表 中 找 出 正 
确 的 寞 常 向 量 ， 然 后 在 服务 程序 的 入 口 处 预 取 指 。 由 此 可 以 看 到 各 目 都 有 专用 总 线 的 好 处 : 入 栈 与 
取 指 这 两 个 工作 能 同时 进行 。 


9.1.3 ”时 新 寄 季 如 


在 入 栈 和 取 回 量 操作 完成 之 后 ， 执 行 服务 例 程 之 前 ， 还 要 更 新 一 系列 的 寄存 其: 
@ SP: 在 入 栈 后 会 把 堆栈 指针 〈PSP 或 MSP) 更 新 到 新 的 位 置 。 在 执行 服务 例 程 时 ， 将 由 MSP 
负责 对 扒 栈 的 访问 。 
@ PSR: 更 狐 IPSR 位 段 (地 处 PSR 的 最 低 部 分 的 值 为 狐 啊 应 的 寞 第 编写。 
PC: 在 取 癌 量 完成 后 ，PC 将 指 问 服务 例 程 的 入 口 地 址 ， 
@ LR: 在 出 入 ISR 的 时 候 ，LR 的 值 将 得 到 重新 的 诠释 ， 这 种 特殊 的 值 称 为 “EXC_RETURN”， 
在 寞 党 进入 时 由 系统 计算 并 赋 给 LR， 并 在 异常 运 回 时 使 用 它 。EXC_RETURN 的 二 进 制 值 除了 
最 低 4 位 外 全 为 17， 而 其 最 低 4 位 则 有 男 外 的 含义 (后 面 讲 到 ， 见 表 9.3 和 表 9.4) 。 
以 上 是 在 啊 应 异常 时 通用 寄存 器 的 变化 。 男 一 方面 , 在 NVIC 中 , 也 会 更 狐 奉 干 个 相关 有 寄存 右 。 
例如 ， 新 啊 应 异常 的 其 起 位 将 被 清除 ， 同 时 其 活动 位 将 被 置 位 。 


















































9.2 ” 异 弟 返回 


当 异 和 常服 务 例 程 执行 完毕 后 ， 需 要 很 正式 地 做 一 个 “异常 返回 ”动作 序列 ， 从 而 恢复 先前 的 系 
统 状 态 ， 才 能 使 被 中 断 的 程序 得 以 继续 执行 。 从 形式 上 看 ， 有 3 种 途径 可 以 触发 异常 返回 序列 ， 如 
表 9.2 所 示 。 而 不 管 使 用 哪 一 种 ， 都 需要 用 到 先前 储 到 LR 的 EXC_RETURN 。 


表 9.2 触 友 中 断 返 回 的 指令 


当 LR 存 储 了 EXC_RETURN 时 ， 使 用 BX LR 即 可 返回 


POP 。 {PC} 和 在 服务 例 程 中 ，LR 的 值 常常 会 被 压 入 栈 。 此 时 即 可 使 用 POP 指令 




















把 LR 存储 的 EXC_RETURN 往 PC 里 弹 ， 从 而 启动 处 理 器 的 中 断 返 回 
序列 


把 PC 作为 目的 寄存 器 ， 亦 可 启动 中 断 返 回 序列 


POP {...,PC} 
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有 些 处 理 器 使 用 特殊 的 返回 指令 来 标示 中 断 返 回 ， 例 如 8051 残 使 用 reti。 但 是 在 CM3 中 ， 征 通过 
把 EXC_RETURN 往 PC 里 写 来 识别 返回 动作 的 。 因 此 ， 可 以 使 用 上 述 的 常规 返回 指令 ， 从 而 为 使 用 c 语 
言 编写 服 务 例 程 扫 清 了 最 后 的 障碍 (无 需 特殊 的 编译 器 命令 ， 如 __interrupt) 。 

在 局 动 了 中 断 返 回 序 列 后 ， 下 述 的 处 理 束 将 进行 : 
1. 出 栈 : 先前 压 入 栈 中 的 寄存 器 在 这 里 恢复 。 内 部 的 出 栈 顺 序 与 入 栈 时 的 相对 应 ， 堆 栈 指针 的 值 
也 改 回 先前 的 值 。 
2. 更 新 NVIC 寄 存 堪 : 伴随 看 异常 的 返回 ， 它 的 活动 位 也 被 硬件 清除 。 对 于 外 部 中 断 ， 倘 奇 中断 输 
入 再 次 被 置 为 有 效 ， 巧 起 位 也 将 再 次 置 位 ， 新 一 次 的 中 断 响应 序列 也 可 随 之 再 次 开始 。 


9.3 ” 衣 套 的 中 断 


在 CM3 内 核 以 及 NVIC 的 深 处 ， 就 已 经 内 建 了 对 中 断 骸 僚 的 全 力 文 持 ， 根 本 无 需 使 用 汇编 去 写 埋 
皮 代 人 码 (wrapper code)。 事 实 上 , 我们 要 做 的 束 只 是 为 每 个 中 断 适 当地 建立 优先 级 , 不 用 再 操心 别 的 。 
表现 在 : 

第 一 、 ”NVIC 和 CM3 处 理 右 会 根据 优先 级 的 设置 来 控制 抢占 与 舱 套 行为 。 因 此 ， 在 某 个 寞 党 下 
在 响应 时 ， 所 有 优先 级 不 高 于 它 的 寞 党 都 不 能 抢占 之 ， 而 且 它 日 己 也 不 能 抢占 自己。 

第 二 、 有 了 目 动 入 栈 和 出 栈 ， 允 不 用 担心 在 中 断 发 生 租 僚 时 ， 会 使 寄存 吉 的 数据 损毁 ， 从 而 
可 以 放心 地 执行 服务 例 程 。 

然而 ， 有 一 件 事 情 却 必须 更 加 一 丝 不 徊 地 处 理 了 ， 否 则 有 功能 亲 乱 其 至 死机 的 危险 。 这 就 是 计 
和 拭 主 堆栈 容量 的 最 小 安全 值 。 我 们 已 经 知道 ， 所 有 服务 例 程 都 只 使 用 主 堆栈 。 所 以 当中 断 航 套 加 深 
时 ， 对 主 堆栈 的 压力 会 增 大 :; 每 舱 套 一 级 ， 束 至 少 再 需要 8 个 字 ， 即 32 凶 市 的 堆栈 空间 一 一 而 且 这 
还 没 算 上 ISR 对 堆栈 的 额外 需求 ， 并 且 何 时 般 套 多 少 级 也 是 不 可 预料 鸭 。 如 果 主 堆栈 的 容量 本 来 孢 已 
经 所 剩 无 几 了 ， 中 断 租 套 又 突然 加 深 ， 则 主 堆 栈 有 被 用 罕 的 凶险 。 这 吏 好 像 已 经 表现 出 了 高 血压 估 
象 的 时 候 ， 情 绪 又 一 激动 ， 融 容易 中 风 一 役 。 中 风 是 一 大 杀手 ， 而 堆栈 洲 出 同样 是 很 致命 的 ， 乞 会 
使 入 栈 数 据 与 主 堆栈 前 面 的 数据 区 友 生 混 迭 ， 使 这 些 数据 被 破 坏 ， 车 在 服务 例 程 运 回击 混 迭 区 的 数 
据 又 被 更 改 了 ， 则 堆栈 内 容 补 破坏。 这么 一 来 在 执行 中 汤 返 回 后 ， 系 统 极 可 能 功能 茶 乱 ， 其 至 当场 
锐 一 击 秒 杀 一 一 程序 跑 飞 /死机 ! 






















































































常 处理 期 间 ， 同 级 或 低 优先 级 的 异常 是 要 阻塞 的 。 因 此 对 于 同一 个 异常 ， 只 有 在 上 次 实例 的 服务 例 
程 执行 完毕 后 ， 方 可 继续 啊 应 新 的 请 求 。 由 此 可 知 ， 在 SVC 服 务 例 程 中 ， 就 不 得 再 使 用 SVC 指 令 ， 藻 
则 将 fault 伺 候 。 


9.4 ” 咬 尾 中 断 


CM3 为 央 短 中 断 延 人 运 做 了 很 多 努力 ， 第 一 个 要 提 的 ， 束 是 狐 增 的 “ 咬 尾 中 汤 ” (Tail-Chaining) 
机 . 制 ]。 

当 处 理 喜 在 啊 应 某 寞 党 时 ， 如 果 又 发 生 其 它 异 钟 ， 但 它们 优先 级 不 够 局 ， 则 被 阻塞 一 一 这 个 我 
们 已 经 知道 。 那 么 在 当前 的 异常 执行 返回 后 ， 系 统 处 理 悬 起 的 异常 时 ， 倘 若 还 是 先 POP， 然 后 又 把 
POP 出 来 的 内 容 PUSH 回 去 ， 这 不 成 了 砸 锅 炼 铁 再 铸 锅 ， 白 白浪 费 CPU 时 间 吗 ， 可 知 还 有 和 多少 紧 急 的 
事件 悬而未决 呀 ! 正 因此 ，CM3 不 会 傻乎乎 地 POP 这 些 寄存 器 ， 而 是 继续 使 用 上 一 个 异常 已 经 PUSH 
好 的 成 果 ， 消 灭 了 这 种 铺张 浪费 。 这 么 一 来 ， 看 上 去 好 像 后 一 个 异常 把 前 一 个 的 尾巴 咬 掉 了 ， 前 前 
后 后 只 执行 了 一 次 入 栈 / 出 栈 操作 。 于 是 , 这 两 个 异 各 之 间 的 “时 间 沟 ” 变 罕 了 很 多 , 如 图 9.2 所 示 。 
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中 断 #1 
中 断 #2 
中 断 返 回 
主 程序 
线程 模式 ， “Handler 模 式 ”Handler 模 式 ， 线 程 模式 
图 9.2 。 异常 咬 尾 示意 图 
为 进一步 帮助 读者 理解 ， 译 者 从 男 外 文献 上 截取 并 改编 下 图 : 
IROT 一 一 
Pe PUSH SR Wi PUSH sn2 国 届 
处 理 中 断 26-42 一 i>| 不 必要 的 POP 与 PUSH btw| 
on ME T 
处 理 中 断 [12 生 | 车 新 取 癌 量 ， 修改 H+12 | 


寄存 姨 ， 共 需 6 周 期 


图 9.2B 异常 咬 尾 与 常规 处 理 的 比较 ( 以 ARM7TDMI 为 例 ) 


9.5 ”了 晚 到 ( 的 高 优先 级 ) 寞 单 


CM3 的 中 断 处 理 还 有 男 一 个 机 制 ， 它 强调 了 优先 级 的 作用 ， 这 就 是 “ 晚 到 的 异常 处 理 ”。 当 CM3 
对 某 异 党 的 啊 应 序列 还 处 在 早期 : 入 栈 的 阶段 ， 疝 未 执行 其 服务 例 程 时 ， 如 果 此 时 收 到 了 高 优先 级 
异 和 的 请 求 ， 则 本 次 入 栈 就 成 了 为 高 优先 级 中 断 所 做 的 了 一 一 入 栈 后 ， 将 执行 高 优先 级 异种 的 服务 
例 程 。 可 见 ， 它 虽然 来 晚 了 ， 却 还 是 因 优先 级 高 而 受到 人 般 祖 ， 低 优先 级 的 异常 为 它 “ 火 中 取 栗 ”。 

比如 ， 车 在 响应 某 低 优先 级 异常 #1 的 早期 检测 到 了 高 优先 级 异常 #2， 则 只 要 #2 没有 太 晚 ， 奈 
能 以 “ 晚 到 中 断 ” 的 方式 处 理 一 一 在 入 栈 完 毕 后 执行 ISR #2， 如 图 9.3 所 示 。 如 果 措 常 #2 来 得 太 晚 ， 
以 至 于 已 经 执行 了 ISR #1 的 指令 ， 则 按 普通 的 抢占 人 处理， 这 会 需要 更 多 的 处 理 器 时 间 和 额外 32 字 节 
的 堆栈 空间 。 

在 ISR 扫 2 执行 完毕 后 ， 则 以 刚刚 讲 过 的 “ 忠 尾 中 断 ” 方 式 ， 来 局 动 ISR 权 的 执行 。 
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异常 #1 


( 低 优先 级 ) 


sg 关 
(高 优先 级 ) 
程序 
流程 






取向 量 异常 #2 迟到 的 最 后 期 限 


9.3 ” 晚 到 异常 的 处 理 模式 图 


9.6 “ 异 间 返回 值 


前 面 已 经 讲 到 ， 在 进入 异常 服务 程序 后 ,将 目 动 更 新 LR 的 值 为 特殊 的 EXC_RETURN。 这 是 一 个 高 
28 位 全 为 1 的 值 ， 只 有 [3:0] 的 值 有 特殊 含义 ， 如 表 9.3 所 示 。 当 异常 服务 例 程 把 这 个 值 送 往 PC 时 ， 就 
会 启动 处 理 器 的 中 断 返 回 序列 。 因 为 LR 的 值 是 由 CM3 自 动 设置 的 ， 所 以 只 要 没有 特殊 需求 ， 就 不 要 
改动 它 。 


表 9.3 “EXC_RETURN 位 段 详解 


0= 返 回 后 进入 Handler 模 式 
1= 返 回 后 进入 线程 模式 


1 | 保 久 必用 0 





总 结 一 下 表 9.3， 可 以 得 出 ， 合 法 的 EXC_RETURN 值 共 3 个 ， 如 表 9.4 所 示 
表 9.4 合法 的 EXC_RETURN 值 及 其 功能 


EXC_RETURN ”功能 
数值 
OxFFFF_FFF1 ”返回 handler 模 式 
0xFFFF_FFF9 返回 线程 模式 ， 并 使 用 主 堆栈 (SP=MSP) 
0xFFFF_FFFD ”返回 线程 模式 ， 并 使 用 线程 堆栈 (SP=PSP) 
如 果 主 程序 在 线程 模式 下 运行 ， 并且 在 使 用 MSP 时 被 中 断 ， 则 在 服务 例 程 中 LR=0xFFFF_FFF9( 主 
程序 被 打 断 前 的 LR 已 被 自动 入 栈 ) 。 
如 果 主 程序 在 线程 模式 下 运行 ， 并 且 在 使 用 PSP 时 被 中 断 ， 则 在 服务 例 程 中 LR=OxFFFF FFFD (〈 主 


146 


Cortex-M3 权威 指南 


波 
\O 
攻 


程序 被 打 断 前 的 LR 已 被 目 动 入 栈 ) 。 


中 断 #1 
( 低 优先 级 ) 


中 断 #2 
(高 优先 级 ) | 





主 堆栈 主 堆 材 主 堆 材 
| | | | 
线程 模式 Handler ， Handler | Handler ， i 
模式 | 术 式 。 模式， 人 S 于 罗 


LR=OxFFFF FFF9 LR=OxFFFF FFF1 


图 9.4 LR 的 值 在 异常 期 间 被 设置 为 EXC_RETURN ( 线程 模式 使 用 主 堆栈 ) 


如 果 主 程序 在 Handler 模 式 下 运行 ， 则 在 服务 例 程 中 LR=0xFFFF FFF1〈 主 程序 被 打 断 前 的 LR 已 被 
目 动 入 栈 ) 。 这 时 的 所 谓 “ 主 程序 ”， 其 实 更 可 能 是 被 抢占 的 服务 例 程 。 事 实 上 ， 在 级 套 时 ， 更 深 
层 ISR 所 看 到 的 LR 总 是 0xFFFF_FFF1， 如 图 9.5 所 示 。 

中 断 #1 
人 优先 级 | | 


中 断 #2 
(高 优先 级 ) ET 














Main Program 


进程 堆栈 主 堆 村 进程 堆栈 
| | | | 

线程 模式 Handler ， Handler ' Handler ， = 
模式 本 式 模式 


LR=OxFFFF FFFD LR=OxFFFF FFF1 


到 9.5 ”LR 的 值 在 异 尝 期 间 被 设置 为 EXC_RETURN ( 线程 模式 使 用 进程 堆栈 ) 
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由 EXC_RETURN 的 格式 可 见 ， 我 们 不 能 把 0xFFFF FFFO-0xFFFF FFFF 中 的 地 址 作为 任何 返回 地 址 。 
其 实 也 并 不 用 担心 会 弄 错 ， 因 为 CM3 已 经 把 这 个 范围 标记 成 “ 取 指 不 可 区 ”了 。 


9.7 “中断 延迟 


在 设计 实时 系统 时 ， 必 须 对 中 断 延 迟 进行 严肃 和 仔细 地 估算 。 在 这 里 ， 中 断 延 迟 的 定义 是 : 从 
检测 到 某 中 断 请 求 ， 到 执行 了 其 服务 例 程 的 第 一 条 指令 时 ， 已 经 流逝 了 的 时 间 。 在 CM3 中 ， 大 存储 
囊 系 统 够 快 ， 且 总 线 系统 允许 入 栈 与 取 指 同时 进行 ， 同 时 该 中 断 可 以 立即 啊 应 ， 则 中 断 延 到 是 雷 打 
不 动 的 12 周 期 〈 满 足 便 实时 所 要 求 的 确定 性 ) 。 在 与 时 间 赛 跑 的 这 12 个 周期 里 ， 处 理 器 内 部 一 直 开 
足 马 力 ， 进 行 了 入 栈 、 取 癌 量 、 更 新 寄存 堪 以 及 服务 例 程 取 指 的 一 系列 操作 。 但 大 存 储 需 太 慢 以 至 
于 引入 等 待 周期， 或 者 还 有 其 它 因素 ， 则 会 引入 额外 的 延 时 一 一 反正 如 果 有 拖 后 腿 的 ， 那 绝 不 可 能 
是 CM3 内 核 。 

当 处 理 咬 尾 中 断 时 ， 省 去 了 堆栈 操作 ， 因 此 切入 新 异常 服务 例 程 的 耗 时 可 以 短 至 6 周期 。 

有 些 指令 需要 较 多 的 周期 才能 完成 。 它 们 是 除法 指令 ， 双 字 传 送 指令 LDRD/STRD 以 及 多 重 数 气 
传送 指令 (LDM/STM)。 

对 于 前 两 者 ，CM3 将 为 了 保证 中 断 及 时 啊 应 而 取消 它们 的 执行 ， 竺 返回 后 重新 开始 一 一 这 牺牲 
了 一 点 性 能 ， 以 及 某 些 子 程序 的 一 点 个 人 利益 ， 但 换 来 了 对 意外 事件 的 更 快 救 援 。 

对 于 LDM/STM， 则 有 男 外 的 处 理 方 式 。 因 为 它们 不 照 前 两 者 那么 浑然 一 体 一 一 它们 其 实 是 一 上 串 
LDR/STR 的 速度 优化 版 。 于 是 ， 为 了 加 速 中 断 的 响应 ，CM3 文 持 LDM/STM 指 令 的 中 止 和 继续 ， 束 好 像 
它们 只 是 普通 的 一 串 LDR/STR 一 样 。 为 了 实现 “指令 撕 裂 与 粘 合 ”的 目的 ， 需 要 记录 中 断 时 数据 传送 
的 进程 。 为 此 , CM3 在 xPSR 中 开 出 硅 干 个 “ICl 位 ”, 记录 下 一 个 即将 传送 的 寄存 器 是 哪 一 个 (LDM/STM 
在 汇编 时 ， 都 把 寄存 堪 号 升序 排序 ) 。 在 服务 例 程 返回 后 ，xPSR 被 弹出 ，CM3 再 从 ICI bits 中 获取 当 
时 LDM/STM 执 行 的 进展 ， 从 而 可 以 继续 传送 。 

这 个 办 法 听 起 来 是 个 好 主意 ， 只 是 在 个 别 情况 下 还 有 一 点 限制 ，IF-THEN(IT) 指 令 的 执行 也 需要 
在 xPSR 中 使 用 几 个 位 ， 可 它 需 要 的 位 刚好 与 1cl 位 重合 (类似 c 中 的 union) both ICl bits 和 IT 条 件 都 
记录 在 EPSR 中 。 所 以 ， 如 果 在 IF-THEN 中 使 用 了 LDM/STM， 则 不 再 记录 LDM/STM 的 执行 进度 。 但 尽管 
如 此 ， 及 时 啊 应 中 断 依 然 是 首要 任务 。 此 时 只 好 把 LDM/STM 取 消 ， 竺 中 断 返 回 后 继续 执行 
详 注 : 仔细 的 读者 可 能 会 注意 到 ，xPSR 中 有 很 多 位 空 看 没 用 ， 从 而 可 能 想 不 通 ， 为 叭 要 让 “有 人 可 怜 没 人 爱 ， 有 人 
却 忙 不 过 来 ”。 这 可 能 是 因为 在 其 它 蒜 式 中 ， 这 些 位 被 用 掉 了 ， 或 者 还 有 其 它 什 么 难言之隐 。 

另外 ,如 果 在 总 线 接口 上 还 有 未 完成 的 (outstanding) 数 据 传送 , 例如 有 一 个 带 缓冲 的 写 操作 未 完 
成 , 处 理 器 也 只 能 等 待 此 传送 完成 。 这 是 过 不 得 以 的 一 一 只 有 这 样 , 才能 保证 在 发 生 了 总 线 fault 时 ， 
其 服务 例 程 能 够 安全 地 抢占 其 它 程序 。 

当 多 个 中 断 同时 请 求 时 ， 也 会 发 生 中 断 延 迟 ， 这 表现 在 只 有 优先 级 最 高 的 得 到 立即 响应 ， 所 有 
其 它 的 中 断 将 被 延 民 。 另 外 ， 在 中 断 先 套 时 ， 每 个 中 断 都 会 阻 时 同 级 和 低 优 先 级 的 中 断 。 最 后 ， 如 
果 中 断 被 掩蔽 (也 就 是 俗称 的 关中 , 在 多 任务 系统 下 满 地 都 有 ) ， 则 在 掩蔽 期 间 也 会 附加 中 断 延 迟 。 


9.8 ”异常 啊 应 期 | 旧 的 faults 


Faults 是 运行 时 发 生 各 种 故障 的 表现 , 在 中 断 啊 应 期 间 的 故障 也 不 例外 。 中 断 啊 应 的 每 一 步骤 都 
可 以 触发 faults。 
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9.8.1 ”入 材 期 间 


如 条 在 入 栈 期 间 引 起 了 总 线 fault， 则 本 次 入 栈 操作 将 被 强行 中 止 ， 并 且 把 总 线 开 第 巧 起 或 者 在 
允许 时 立即 啊 应 。 硅 除 能 了 总 线 fault， 则 此 次 故障 将 成 为 “ 便 伤 ”一 一 上 访 全 便 fault。 在 总 线 fault 
锐 使 能 的 情况 下 ， 如 果 它 的 优先 级 比 正在 响应 的 寞 党 高 ， 则 抢占 之 ， 否 则 将 巧 起 下 到 引起 fault 的 寞 
常 执行 完毕 。 这 种 情况 被 称 为 “入 栈 错 误 ”(stacking error)， 由 总 线 fault 状 态 寄 存 器 (BFSR， 地 址 : 
0xE000 ED29) 的 STKERR 位 指示 (位 偏 移 : 4) 。 

如 果 入 栈 操 作 引 起 MPU 访 问 违 例 ， 则 产生 存储 管理 fault， 并 且 必 须 能 立即 执行 MemFault 服 务 例 
程 ， 否 则 将 无 条 件 上 访 成 便 fault。 在 发 生 入 栈 时 访问 违例 时 ， 存 储 管理 fault 寄 存 器 (MFSR， 地 
址 :0xE000_ED28) 中 的 MSTKERR 位 《位 偏 移 : 4) 被 置 位 ， 用 于 指示 该 fault。 

入 栈 是 目 动 完成 的 ， 因 此 不 可 能 产生 用 法 fault 一 一 详 者 。 


9.8.2 ”出 村 期 间 


如 果 在 中 断 返 回 时 的 出 栈 期 间 引起 了 总 线 fault， 则 本 次 出 栈 操作 将 被 强行 中 止 ， 并 且 把 总 线 异 









































各 巧 起 或 立即 啊 应 。 奉 除 能 了 总 线 fault， 则 此 次 故障 将 成 为 “使 伤 ” 一 一 上 访 至 使 fault。 其 它 情况 
下 ， 只 要 总 线 fault 的 优先 级 比 当前 的 高 《也 包括 比 当前 最 深 明 套 的 优先 级 局 ) ， 则 可 以 立即 啊 应 。 


这 种 情况 称 为 “出 栈 错 误 ” (unstacking error) ， 由 BFSR.3 指 示 CUNSTKERR 位 ) 。 
类 似 地 ， 如 果 是 因 MPU 访 问 违例 造成 的 MemManage fault， 由 MFSR.3 (MUNSTKERR) 指示 。 了 且 
MemManage fault 的 服务 例 程 必须 能 立即 执行 ， 否 则 无 条 件 便 fault。 


9.8.3 ”有 取 同 量 期 间 


在 取 回 量 期 间 发 生 总 线 fault， 这 是 非常 罕见 的 一 种 情况 ， 这 也 是 最 严重 的 ， 因 此 直接 上 便 fault 
(MPU 的 限制 则 管 不 着 取向 量 操作 一 一 译 者 注 ) 。 这 种 情况 ， 由 硬 fault 状 态 寄 存 器 (HFSR， 地 址 : 
0xE000 ED2C)〉 中 的 VECTTBL 位 (位 偏 移 ，1) 来 指示 。 


9.8.4 无 效 退 回 时 


如 果 LR 中 的 EXC_RETURN 不 是 合法 的 值 〈 合 法 值 见 表 9.4， 包 括 企 图 返回 ARM 状 态 ) ， 则 引起 用 
法 fault。 如 果 用 法 fault 被 除 能 , 也 上 访 成 便 fault。 此 时 ,用 法 Fault 状 态 寄存 器 (UFSR, 地 址 : 0xE000_ED2A) 
中 的 INVPC 位 《位 偏 移 : 2) ， 或 者 是 INVSTATE 位 《位 偏 移 : 1) 置 位 。 
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Cortex-M3 的 低层 编程 


概 响 

汇编 与 C 的 接口 
典型 肘 开 友 尝 往 

2 

与 外 界 互动 

使 用 数据 存储 器 

使 用 互 斥 访问 实现 互 斥 锁 操 作 
使 用 位 带 实现 互 斥 锁 操 作 
使 用 位 段 提取 与 但 表 跳 转 





10.1 概览 





在 CM3 上 编程 ， 既 可 以 使 用 c 也 可 以 使 用 汇编 。 可 能 还 有 其 它 语言 的 编 详 医 ， 但 是 大 多 数 人 还 
古 会 在 C 与 汇编 的 世界 里 游 尺 。C 与 汇编 都 “大 有 所 短 ， 寸 有 所 长 ”， 不 能 互相 取代 。 使 用 C 能 开发 
大 型 程序 ， 而 汇编 则 用 于 执行 特种 任务 。 

在 使 用 不 同 的 工具 链 和 忌 放 时 ， 有 大 量 的 用 法 和 用 量 都 随 之 不 同 。 因 此 ， 本 书 不 会 深入 讲解 怎 
样 精通 一 个 具体 的 工具 链 ， 也 不 会 大 谈 如 何 把 程序 烧 到 板子 上 。 在 第 19 革 和 第 26 章 会 所 到 一 些 入 
门 知 识 ， 其 体内 容 还 需 查 阅 相关 的 文献 和 在 线 帮 助 文档 。 


16.1.1 使 用 汇编 


如 果 工 程 比 较 小 , 使 用 纯 汇 编 常 第 是 可 行 的 , 而 且 能 使 我 们 随心 所 欲 地 优化 和 控制 程序 ,不 过 ， 
这 么 一 来 的 开发 周期 会 变 长 。 尤 其 是 当 工 程 变 大 ， 和 需要 处 理 比 较 复 林 的 数据 结构 ， 以 及 要 省 理 函 数 
库 时 ， 汇 编 那 独 独 的 真面目 束 会 浙 显 出 来 : 各 种 地 址 和 间接 引用 干 头 万 绪 ，bug 劈 头 盖 脸 ;甚至 好 
几 天 都 改 不 完 ， 工 作 量 激增 ， 稍 直 就 是 和 目 眶 。 当 然 ， 如 采 你 想 成 为 系统 开发 的 大 虾 ， 惑 必须 以 “我 
不 下 地 狱 谁 下 地 狱 ” 的 决 恬 ， 去 勇敢 面 对 ， 后 天 下 乐 而 乐 ， 百 和 炬 成 钢 。 
不 论 如 何 ， 时 间 宝 贯 。 我 们 应 该 以 5 来 实现 程序 的 大 框架 ， 而 本 看 好 钢 用 在 刀刃 上 的 原则 来 使 
用 汇编 ， 因 为 具有 在 不 多 的 特殊 场合 是 适合 使 用 汇编 ， 其 全 是 非 使 用 汇编 语言 不 可 的 ， 它 们 包括 : 
@ 无 法 用 C 与 成 的 函数 ， 如 操作 特殊 功能 寄存 右 ， 以 及 实施 互 斥 访问 。 
在 危 筷 关头 执行 处 理 的 子 程 ( 如 ，NMI 服务 例 程 )。 
存储 器 极度 受 限 ， 只 有 使 用 汇编 才 可 能 把 程序 或 数据 挤 进去 。 
执行 频率 非 第 融 的 子 程 ， 如 操作 系统 的 调度 程序 。 
与 处 理 亏 体系 结构 相关 的 子 程 ， 如 上 下 文 切换 。 
对 性 能 要 求 极 蜗 的 应 用 ， 如 防空 炮 的 火 控 系统 。 


160.1.2 使 用 人 


用 <c 写 的 程序 可 以 移植 ， 并 且 操 作 复 傈 数 据 结构 时 和 远 远 比 汇编 方便 。 但 因为 C 是 一 种 通用 语言 一 
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一 人 至少 是 低 等 高 级 语言 , 它 并 不 指定 如 何 初始 化 具体 的 处 理 器 (用 于 在 main 执 行 前 准备 好 执行 环境 )。 
在 解决 这 个 问题 时 ， 不 同 的 工具 链 都 有 自己 的 一 套 ， 因 此 最 聪明 的 办 法 就 是 看 一 看 工具 链 附 带 的 示 
例 程序 。 如 果 使 用 RealView 开 发 套件 (RVDS) 或 者 KEIL 的 RealView 微 控制 器 开发 套件 (RVMDK)， 
则 编译 句 和 汇编 器 是 ARM 提 供 的 ， 而 且 它 们 中 都 附 市 了 很 多 示例 。 如 条 使 用 了 GNU 的 工具 链 ， 则 第 19 
章 以 CodeSourcery GNU 工 具 链 为 例 ， 给 出 一 个 简单 的 示例 (其 它 示 例 可 以 去 网 上 找 )。 

尽管 在 使 用 了 C 后 ， 大 大 加 速 了 开发 ， 但 是 底层 的 系统 控制 往往 还 需要 汇编 代 但 。 很 多 编译 器 
都 允许 我 们 直接 在 C 代 人 码 中 插 汇 编 ， 称 为 “内 联 汇编 另外 还 允许 我 们 写 独 立 的 汇编 模块 ， 与 编译 
后 的 C 模 块 一 起 连接 。 以 往 ， 使 用 内 联 汇编 的 作法 比较 多 ， 但 是 在 ARM 编 译 器 中 ， 不 支持 对 Thumb-2 
引信 的 内 联 汇编 。 取 而 代 之 的 ， 是 从 RealView C 编 译 器 的 3.6 版 开始 ， 新 增 了 所 谓 “ 骨 入 式 汇编 ” 
的 功能 ， 它 支持 Thumb-2 指 令 。 它 让 我 们 可 以 在 Cc 程序 中 插入 使 用 汇编 语言 编写 的 函数 ， 例 如 : 






































_ asm void SetFaultMask (unsigned int new_value) 


{ 





/ /在 这 里 使 用 汇编 代码 实现 本 函数 
MSR FAULTMASK, new_ value // 把 new_value 写 入 FAULTMASK 中 
BX LR // 返回 主 程序 (不 可 省 略 ) 








RealView C 编译 器 对 骨 入 式 汇 编 的 详细 论述 ， 在 《RVCT 3.6 Compiler and Library 
Guide(Ref6)》 中 给 出 。 

在 CM3 中 ， 般 入 式 汇编 还 是 比较 需要 的 ， 因 为 常 钊 会 有 访问 特殊 功能 寄存 堪 的 时 候 。 比 如 ， 在 
设置 堆栈 时 ， 束 要 使 用 MRS/MSR 指令 。 对 于 其 它 不 能 由 编译 需 产 生 的 指令 ， 比 如 NWNFIV/NFE、 互 斥 访 
问 、 存 储 需 隔离 等 指令 ， 也 必须 用 汇编 显 式 给 出 。 

在 以 前 的 ARM 处 理 器 中 , 因为 支持 ARM/Thumb 双重 状态 , 往往 需要 所 谓 的 “interworking”， 
且 不 同 的 源 文件 可 能 需要 编译 成 不 同 状态 下 的 代码 。 在 CM3 中 不 再 有 此 需求 ， 因 为 只 使 用 了 Thumb 
状态 ， 从 而 工程 管理 清 夹 多 了 ，。 

当 使 用 C 开发 程序 时 ， 推 荐 开局 CM3 的 双 字 对齐 管 理 机 制 ( 在 NVIC 配置 与 控制 寄存 器 中 ， 把 
STKALIGN 置 位 )， 代 码 形 如 : 





























#define NVIC _ CCR ((volatile unsigned long *) (OxEOO0O0ED14)) 


*NVIC_CCR = *NVIC_CCR | 0x200; // 设 置 STKALIGN 位 








这 是 用 于 确保 系统 能 严格 遵守 AAPCS 过 程 调用 标准 ， 个 中 细节 请 参阅 第 12 章 。 


10.2 汇编 与 C 的 接口 


在 很 多 情况 下 ， 都 需要 让 C 程序 模块 与 汇编 程序 模块 互相 交互 ， 它 们 包括 : 

@ 在 C 人 代码 中 使 用 了 先入 式 汇编 (或 者 是 在 GNU 工具 下 ， 使 用 了 内 联 汇编 ) 

@ 人 C 程 序 呼叫 了 汇编 程序 ， 这 些 汇 编程 序 是 在 独立 的 汇编 源 文 件 中 实现 的 

@ 汇编 程序 调用 了 C 程 序 

在 这 些 情况 下 ， 必 须知 晓 参 数 是 如 何 传递 的 ， 以 及 值 是 如 何 返 回 的 ， 才 能 在 主 调 函 数 与 子 程序 
之 则 协同 工作 。 这 些 交 互 的 机 制 在 ARM 中 有 明确 的 规定 ， 由 文档 《ARM Architecture Procedure 
Call Standard(AAPCS，Ref5)》 给 出 。 

不 过 ,在 大 多 数 场 合 下 的 情况 都 比较 简单 : 当主 调 函 数 需 要 传递 参数 ( 实 参 ) 时 , 它们 使 用 R@-R3。 
其 中 R8@ 传 递 第 一 个 ，R1 传 递 第 2 个 …… 在 返回 时 ， 把 返回 值 写 到 Re 中 。 在 子 程序 中 ， 可 以 随心 所 欲 
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地 使 用 Re-R3， 以 及 R12《〈 回 顾 第 9 章 ， 想 想 为 什么 会 PUSH 它们 )。 但 知 使 用 R4-R11， 则 必须 在 使 用 
之 前 先 PUSH 它 们 ， 使 用 后 POP 回来 。 

可 见 ， 汇 编程 序 使 用 Re-R3，R12 时 会 很 舒服 。 但 是 如 果 换 个 立场 一 一 汇编 要 呼叫 C 函 数 ， 则 考 
虑 问题 的 方式 就 有 所 不 同 :， 必须 意识 到 子 程序 可 以 随心 所 欲 地 改写 Re-R3，R12， 却 决 不 会 改变 
R4-R11。 因 此 ， 如 果 在 调用 后 还 需要 使 用 Re-R3,R12， 则 在 调用 之 前 ， 必 须 先 PUSH， 从 C 函 数 返 回 
后 再 POP 它们 ， 对 R4-R11 则 不 用 操心 。 在 本 章 的 示例 程序 中 ， 绝 大 多 数 只 是 调用 汇编 子 程序 ， 它 们 
只 影响 少量 寄存 器 ， 或 者 会 在 返回 前 恢复 寄存 器 的 内 容 ， 所 以 往往 没有 严格 遵守 AAPCS。 这 主要 是 
为 了 突出 其 它 重点 ， 简 化 程序 ， 请 读者 不 要 钻 牛 角 尖 。 


10.3 上 典型 的 开发 流程 


在 开发 基于 CM3 的 应 用 程序 时 ， 和 常常 有 多 种 源 程序 和 库 ， 有 些 是 自己 写 的 ， 有 些 是 别人 已 经 写 
好 的 《尤其 是 底层 的 软件 )。 下 述 这 些 开发 工具 生成 代码 的 流程 部 差 不 风 \ 离 。 对 于 最 基本 的 应 用 ， 也 
ea 连接 需 以 及 二 进 制 文件 处 理工 具 。 如 果 使 用 的 是 ARM 的 工具 , 如 RVDS 或 RealView 

译 器 工具 CRVCT)， 则 它们 的 流程 如 图 16.1 所 示 。 其 中 的 “分 散 加 载 脚本 ”是 可 选 的 ， 但 是 当 存 
1 则 需要 它 。 

C 源 文件 (.C) 目标 文件 | 


ml armcec 
侗 译 刁 可 执行 映像 
(.axf / .elf) 


"| armlink a 
连接 器 


fromelf 
汇编 源 文件 - 目标 文件 (.0) > RN i 
本 时 armasm ml 


反 汇编 代码 (.txt) 





















































Il 
像 ( Sm 


图 10.1 使 用 ARM 工 具 链 时 的 典型 开发 流程 


在 上 述 基 本 工具 之 外 ，RVDS 还 提供 了 大 量 的 其 它 实 用 程序 ， 比 如 一 个 集成 开发 环境 (IDE) 以 及 
调试 器 。 欲 知 详情 ， 可 登录 ARM 网 站 (www .arm .com)。 


10.4 第 一 步 工作 


本 章 为 提供 了 寿 干 汇编 写 的 例子 ， 在 实际 应 用 中 ， 这 些 程序 都 会 用 C 写 。 但 是 以 汇编 的 方式 呈 
现 ， 有 助 于 让 读者 更 深 更 好 地 理解 CM3 的 工作 内 幕 ， 以 便 在 以 后 用 C 开 发 时 ， 已 经 是 过 来 人 ， 心 里 更 
有 底 。 这 里 给 的 程序 都 用 ARM 的 汇编 右 (armasm) 来 汇编 ,其它 工 具 可 能 对 语法 格式 有 些 不 同 的 要 求 。 
而 且 实 际 上 ， 开 发 工具 几乎 都 会 把 局 动工 作 做 好 ， 让 我 们 根本 不 用 去 想 还 有 局 动 代码 的 事 〈 不 过 ， 
这 也 妨碍 了 我 们 学 习 得 更 深入 )。 下 和 面 ， 就 隆重 请 出 本 书 第 一 个 完整 的 示例 程序 (请 参考 回 量 表 来 
阅读 ): 
STACK_TOP EQU 0x20002000 ; SP 初始 值 ， 和 常数 

AREA |Header Code|, CODE 
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DCD STACK_TOP ; 栈 顶 (MSP 的 ) 
Dt Start ; 复位 问 量 
ENTRY ; 指示 程序 从 这 里 开始 执行 
start ; 主 程序 开始 
; 人 彻 始 化 案 存 器 
MOV r0, 0 ; 加 载 循 环 变 量 的 初 值 
MOV 二 区 #0 ; 初始 化 运算 结 采 的 值 
; 计算 10+9+8+. . .+1 
loop 
ADD rl, r0 ; R1 += RO 
SUBS EO, #1 ; R0 目 减 ， 并 是 根据 结果 更 狐 标 志 (有 ”Ss” 后 级 ) 
BNE loop 1 (ROI=0) doko Joopy 
; 现在 ， 运 算 结 果 在 R1 中 
deadloop 
B deadloop ; 工作 完成 后 ， 进 入 无 穷 循 环 
END ; 标记 文件 结束 








这 个 例子 非常 简单 ， 它 只 初始 化 了 SP 以 及 PC， 以 及 初始 化 了 需要 使 用 的 寄存 器 ， 然 后 就 执行 连 
加 循环 中 。 

使 用 ARM 工 具 来 汇编 该 程序 ， 命 令 为 : 

5> armasim ==Cp Cortex=m3 =0 testl,o testl;,s 

命令 行 中 的 “-o7” 指示 后 面 的 是 输出 文件 名 一 一 也 瓯 是 test1.0, 它 也 束 是 目标 文件 。 接 下 来 ， 
我 们 瓯 要 使 用 连接 左 ， 连 接 各 目标 文件 〈 本 例 中 只 有 一 个 ) 并 创建 出 一 个 可 执行 的 映像 〈ELF)， 命 

$> armlink -rw _ base 0x20000000 --To_base 0x0 =--map -Oo testl.elf test1.o 

这 里 ,“--ro_base 8x8” 的 意思 是 说 ， 把 只 读 区 (也 就 是 程序 ROM)〉 的 起 始 地 址 设 为 6;， 而 
“--rw_base 686x26686868688” 则 指定 读 写 区 (数据 存储 器 ，〉 从 6x2886886888 开 始 〈 在 本 例 中 ， 我 们 
没有 定义 任何 RAM 数 据 )。“ - -map ”选项 则 有 要求 连 接 玲 给 出 存储 融 分 配 映 射 表 ， 通 过 它 ， 可 以 得 看 编 
详 后 的 映像 中 内 存 的 布局 。 

最 后 ， 我 们 要 生成 二 进 制 烧 写 文 件 ， 合 令 行 为 : 

Ss> Tromelf ==-bin ==o0U0tput testl bin testlelTf 

如 下 想 要 看 看 生成 的 映像 是 否 确 实 是 我 们 想 要 的 ， 还 可 以 像 这 样 对 它 做 反 汇 编 : 

$> fromelf -~c -output testl1.list testl.elf 

(其 实 基 本 上 很 少 会 做 上 步 一 一 详 者 注 ) 

如 果 一 切 都 好 ， 束 可 以 把 ELF 映 像 或 者 二 进 制 代码 烧 写 到 费 件 中 了 ， 也 可 使 用 模拟 占 来 测试 。 


10.5 与 外 界 互动 


如 果 能 把 目 己 的 单片机 与 外 面 的 世界 联系 起 来 ， 那 该 是 多 么 令 人 兴奋 和 值得 期 待 呀 ! 我 们 第 党 
从 点 亮 LED 开 始 ， 仿 佛 是 前 进 路 上 的 明灯 ， 尽 管 它 提供 的 信息 非常 有 限 ， 但 闪烁 的 灯光 常 给 人 “ 它 
活 痢 ”的 印象 。 如 果 要 输出 更 多 的 信息 ， 则 最 容易 上 手 的 方式 就 是 往 一 个 终端 发 送 文 本 。 在 能 入 式 
产品 开发 中 ， 通 第 是 把 一 个 UART 接 到 电脑 上 来 实现 的 。 例 如 ， 运 行 Windows 的 电脑 大 多 会 有 一 个 附 
送 的 “超级 终端 ”程序 ， 通 过 它 可 以 很 方便 地 让 电脑 扮演 字符 终端 的 角色 。 

CM3 内 核 没 有 包含 UART 接 口 ， 但 基于 CM3 的 单片机 都 会 有 的 ， 而 且 基 本 还 不 止 一 个 。 不 同心 搬 
的 UART 用 法 不 同 , 但 是 本 书 就 不 讲 具体 的 UART 驱 动 了 ， 扯 得 太 远 也 跑题 。 在 下 一 个 例子 中 ， 我们 假 
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设 系统 中 有 一 个 UART，UART 中 有 一 个 “状态 位 ” 用 于 指示 输出 缓冲 是 否 已 经 准备 好 接收 新 数据 ，。 
另外 ， 还 需要 一 个 电 平 转换 器 件 ( 如 MAX3232)， 用 于 把 单片机 I/0 口 使 用 的 电 平 转换 成 RS-232 使 用 
的 电 平 。 其 实 ，UART 并 不 是 输出 文本 的 唯一 选择 ， 在 CM3 中 有 很 多 调试 组 件 ， 它 们 提供 了 一 系列 输 
出 调试 消息 的 方法 : 

@ 半 主 机 (Semihosting): 取决 于 调试 器 与 代码 库 的 文 持 ， 可 以 通过 NVIC 的 调试 寄存 需 来 
做 Semihosting (通过 调试 探测 设备 ， 以 printf 的 形式 输出 消息 )， 第 15 章 还 要 深入 讨论 
这 个 主题 。 使 用 时 ， 你 要 在 Cc 程序 中 使 用 printf 函 数 ， 然 后 其 输出 就 会 显示 在 终端 ， 或 者 
显示 在 调试 软件 标准 输出 (STDOUT) 上， 具体 细节 还 是 请 参阅 第 15 章 。 

@ ”硬件 水 平 上 支持 的 跟踪 : 如 果 使 用 的 CM3 单 片 机 提供 了 一 个 跟踪 接口 ， 并 且 有 一 台 外 部 的 
跟踪 接口 分 析 仪 “TPA 的话， 则 可 以 解放 出 UART， 而 使 用 ITM 来 做 形 如 printf 的 调试 。 
跟踪 端口 就 是 为 了 这 种 调试 而 生 的 , 它 可 比 UART 专 业 多 了 一 一 速度 快 而 且 能 提供 多 条 信道 。 

@ 便 件 水 平 上 文 持 的 跟踪 一 一 通过 串 行 线 查 看 器 : 作为 后 备 方案 ，CM3 的 TPIU 还 提供 了 “ 曲 
行 线 查 看 器 (SWV)” 操 作 模 式 。 有 了 它 ， 束 可 以 使 用 远 比 TPA 便 宜 的 人 硬件 来 捕获 从 ITM 发 来 
的 消 筷 。 不 过 ， 在 SWwV 模 式 下 ， 和 带宽 并 不 富余 ， 因 此 在 需要 输出 大 量 数据 时 ， 本 法 就 显得 
有 些 力不从心 。 


16.5.1 “Hello World” 示 全 程序 


这 侈 来 真 格 的 了 。 不 过 在 开始 前 ， 先 要 指出 使 用 何 种 形式 把 一 个 字符 发 给 UART。 可 以 把 友 达 子 
从 的 代码 做 成 一 个 子 程序 ， 由 其 它 函 数 呼叫 来 输出 数据 。 这 样 的 好 处 在 于 ， 如 果 输 出 设备 变 了 ， 则 
只 需 重 写 这 个 子 程序 ， 就 可 以 使 用 不 同 的 说 备 ， 这 种 修改 动作 也 有 目 己 的 术语 ， 叫 “retargeting” 
必 目 标 重 选 ”? 这 词 还 真 不 好 翻 详 ~)。 在 大 型 程序 中 ， 这 是 一 个 很 重要 的 思想 一 一 软件 分 层 ， 而 
且 这 也 是 “设备 无 天 性 ”和 “可 移植 性 ”的 前 提 。 

让 我 们 看 看 一 个 简单 的 字符 输出 子 程 是 啥 模样 : 

































































UARTO_BASE EQU 0x4000C000 
UARTO FiAC EOU UARTO_BASE+0x018 
UARTO_DATA EQU UARTO_BASE+0x000 
Putc ; 该 子 程 使 用 UART 来 发 一 个 字符 
; 入 口 条 件 : Ro = 需要 发 的 字符 
PUSH {R1, R2, LR} ; 保存 寄存 器 
LDR RL =UARTO_FLAG 
PutcWaitLoop 
LDR RZ, [R1] ; 读 取 状态 标志 
Te 5 #0x20 ; 检查 “发 送 缓冲 满 ” 标 志 
BNE PutcWaitLoop ; 若 已 满 则 重 试 〈 若 UART 当 掉 了 ， 则 可 能 死 循环 ) 
LDR = =UARTO_DATA ; 有 空位 时 ， 就 把 UART 发 送 站 寄存 器 地 址 加 载 
STRBE. RO; [R1] ; 然后 通过 它 把 子 符 送 给 输出 绥 冲 区 
POP {R1, R2, PC} ; 子 程 返回 








在 这 里 的 UART 是 虚构 的 ， 其 寄存 右 的 地 址 和 位 定义 都 只 是 为 了 演示 ， 抛 砖 引 玉 。 如 果 雷 同 ， 纯 
属 巧合 。 在 实战 时 , 还 需要 根据 目 己 使 用 的 UART 来 重 塑 代码 ,有 些 UART 还 要 求 更 精密 地 检 得 状态 位 。 
另外 ， 还 需要 一 个 用 于 初始 化 UART 的 子 程 一 一 至 少 得 设置 波 特 率 吧 。 我 们 为 了 突出 主题 ， 这 些 细节 
就 不 多 谈 了 。 在 第 26 章 中 ， 有 一 个 具体 的 例子 。 

现在 ， 我 们 就 可 以 通过 这 个 基础 设施 一 般 的 子 程 ， 来 构造 一 系列 的 消息 显示 图 数 ， 它 们 都 与 输 
出 字符 的 具体 硬件 无 关 了 。 
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Puts ; 该 子 程 往 URART 送 一 个 字符 串 
; 入 口 条 件 : RO = 竺 输出 字符 串 的 起 始 地 址 
; 这 个 字符 串 必 须 以 零 结 尾 〈cC 语 言 格式 ) 











PUSH RO Rl, -TRY ; 先 保存 寄存 项 
MOV R1, RO ; 把 地 址 捞 贝 到 R1， 因 为 每 会 儿 调 用 Putc 时 还 要 用 
; RO 来 传 参数 
PutsLoop 
EDRB, “RO% [RL]Y 沪 L ; 读 取 一 个 字符 ， 再 目 增 地 址 
CBZ2 RO, PutsLoopExit ; 者 已 到 达 零 字符 ， 则 执行 完毕 ， 退 出 
BL Putc ; 把 这 个 字符 送 往 UART 
B PutsLoop 7 循环 ， 以 输出 下 一 个 学 符 
PutsLoopExit 
BOB: |RO, RL EC ; 子 程序 返回 
有 了 这 个 Puts， 现 在 终于 可 以 正式 请 大 有 牌 出 场 了 一 一 “Hello World” 主 程序 : 
STACK_TOP EQU 0x20002000 ; SP 初始 值 
UARTO_BASE EQU 0x4000C000 
UARTO_FLAG EQU UARTO_BASE+0x018 
Uh eo .ui ol UARTO_BASE+0x000 


AREA | Header Code|, CODE 














DCD STACK_TOP ; MSP 初 始 值 
DCD start ; 复位 问 量 
ENTRY 
Start ; 主 程序 入 口 点 
MOV r0, #0 ; 初始 化 各 寄存 器 
MOV :2 #0 
MOV 2 #0 
MOV 二 多》 #0 
MOV 7 #0 
BL Uart0OInitialize ; 初始 化 UART0 
LDR r0, =HELLO_TXT ; 让 RO 指 问 客串 的 起 始 地 址 
BL Puts 
deadend 
B deadend ; 做 完了 工作 ， 在 这 里 原 地 打转 
; 各 个 子 程序 
Puts ; 该 子 程 往 UART 送 一 个 字符 串 








; 入 口 条 件 : RO = 待 输出 字符 串 的 起 始 地 址 

; 这 个 字符 串 必 须 以 零 结尾 〈C 语 言 格式 ) 

PUSH {RO ,R1, LR} ; 先 保存 寄存 凑 

MOV Rl1, RO ; 把 地 址 拷贝 到 R1， 因 为 竺 会 儿 调 用 Putc 时 还 要 用 
; R0 来 传 参数 


PutsLoop 
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读 取 一 个 字符 ， 再 自 增 地 址 
若 已 到 达 零 字符 ， 则 执行 完毕 ， 退 出 
把 这 个 字符 送 往 UART 


循环， 以 输出 下 一 个 字符 


该 子 程 使 用 UART 来 发 一 个 字符 


你 和 存 寄 存 右 





读 取 状 态 标志 

检查 “发 送 缓冲 满 ”标志 

知已 满 则 重 试 〈 若 UART 当 掉 了 ， 则 可 能 死 循 环 ) 
有 空位 时 ， 就 把 UART 发 送 站 寄存 器 地 址 加 载 
然后 通过 它 把 字符 送 给 输出 绥 冲 区 














LDRB RO, [Rl1], #1 
CBZ RO, PutsLoopExit 
BL Putc 
B PutsLoop 
PutsLoopExit 
POP :tRO; ‘Rly PC 
/ 
Putc 
; 入 口 条 件 : ”RO0 = 需要 发 的 字符 
PUSH {Rl1, R2, LR} 
LDR R11, =UARTO_FLAG 
PutcWaitLoop 
LDR R2, [R1] 
TST R2， #0x20 
BNE PutcWaitLoop 
LDR R11, =UARTO_DATA 
STRB RO, [R1] 
POP {Rili; R27; PC} 
7 
Uart0OInitialize 
; 与 具体 硬件 有 关 ， 也 不 是 主题 ， 故 而 略 
BX LR 
/ 
HELLO_TXT 


DCB “Hello world\n’”,0 
END 


定义 零 结尾 的 “Hello world” 
本 文件 结束 





本 示例 代码 在 各 CM3 单 片 机 之 间 都 是 高 度 可 移植 ， 高 度 与 便 件 无 和 天 的 。 事 实 上 ， 我 们 只 需要 目 
己 写 UarteInitialize 子 程 ， 并 调整 Putc。 之 所 以 日 子 这 么 好 过 ， 是 因为 Putc 与 Puts 已 经 完成 了 














实质 的 工作 。 为 了 锡 上 诬 化 ， 最 好 再 捉 供 儿 个 子 程 ， 用 于 输出 寄存 邢 的 值 。 首 先是 输出 16 进 制 数 的 


于 程 。 
PutHex 
; 入 口 条 件 : R0= 要 显示 的 值 
PUSH {RO-R3, LR} 
MOYV R3, RO 
MOYV 民 避 5 #0O” 
BL Putc 
MOYV RO, # x” 
BL Putc 
MOYV R11, #8 
MOYV R2， #28 
PutHexLoop 
ROR R3, R2 


r 


we 


we 


we 


以 16 进 制 输出 寄存 器 的 值 


把 RO 的 值 拷贝 到 R3， 以 便 每 会 使 用 RO 传递 参数 给 Putc 


先 显 示 “0x” 前 缀 


初始 化 循环 变量 
圆圈 移 位 偶 移 量 





圆 净 右 移 28 格 一 一 相当 于 圆 奖 堪 移 4 格 
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AND RO, R3, #0xF ; 此 时 最 高 4 位 移 至 最 低 4 人 位， 提取 它 们 

CMP RO, #0xA ; 转换 成 ASCII 码 

下 机 GE 

ADDGE RO0, #55 ; 若 大 于 等 于 10, 则 使 用 字母 A-F 表 示 

ORRLT RO, #0x30 ; 否则 转换 到 0-9 原文 使 用 ADDLT， 效 果 相 同 》 
BL Putc ; 输出 一 个 hex 字 符 

SUBS Rd #1 ; 循环 变量 日 减 

BNE PutHexLoop ; 检查 循环 变量 是 否 已 减 到 0， 从 而 循环 8 次 
POP {RO-R3, PC} ; 显示 完毕 ， 子 程 返 回 








使 用 这 个 子 程 来 输出 寄存 天 的 值 很 方便 ， 如 条 在 笔试 的 时 候 迪 到 这 个 题目 ， 葡 可 以 直接 抄 上 去 
啦 ! 但 如 果 是 让 你 输出 16 进 制 数 ， 可 束 不 像 乍 一 看 的 那么 好 对 付 了 ， 而 且 它 还 很 下 很 苔 力 ， 能 放 倒 
一 大 批 人 一 一 要 计算 32 位 乘除 法 《考官 阴 舌 : 小 样 作 腿 了 吧 )! 好 在 CM3 下 几 后 ， 市 出 来 两 壬 大 力 丸 
一 一 便 件 乘除 法 指令 。 服 下 它们 ， 转 映 以 后 你 会 练 成 护 体 神功 ， 看 见 量 螂 也 不 怕 不 怕 啦 ! 不 过 ， 可 
别 神经 比较 大 ， 因 为 考官 还 下 了 为 一 个 小 套 儿 等 你 钻 呢 ， 在 计算 期 间 ， 我 们 计算 出 的 字符 会 是 逆序 
的 一 一 即 如 果 不 采 取 接 施 ，e8@x7B(123) 会 以 321 的 顺序 输出 ! 因此 ， 只 好 为 开 一 个 缓冲 区 来 保存 中 
间 结 来 一 一 先 把 所 有 的 子 符 逆序 帮 到 这 个 绥 冲 区 中 ， 来 个 负 负 得 正 ， 最 后 使 用 Puts 来 一 步 到 位 地 显 
示 整 个 结 末 。 在 本 例 中 ， 使 用 栈 空间 来 存储 这 个 缓冲 区 ， 用 完 即 释放 一 一 在 C 编 程 中 ， 这 叫 目 动 局 

















部 数组 变量 。 
PutDec ; 以 10 进 制 输出 寄存 右 的 值 


; 入 口 条 件 : R0= 要 显示 的 值 
; 因为 是 32 位 宽 ， 最 大 值 (0xffff ffff) 需要 10 个 10 进 制 位 表示 ， 再 加 上 零 结尾 ， 共 需 11 字 节 





PUSH {RO-R5, LR} ; 保存 寄存 器 的 值 
MOV 长 全 SP ; 把 当前 堆栈 指针 拷贝 到 R3 
SUB SP， SP， #12 ; 为 文本 缓冲 区 保留 出 11 个 字 节 《因为 是 满 栈 ) 





MOV R1, #0 ; NULL 字符 


™ 


























STRE:.. R11y [R3, #-1]! ; 先 把 NULIL 字 符号 到 学 符 串 的 结尾 〈 把 各 字符 逆序 输出 ， 
; 好 “ 负 负 得 正 ”) 。 这 里 使 用 了 更 新 基 址 的 预 索 引 
MOV Ry $0 ; R5 保 存 除数 
PutDecLoop 
UDIV R4, RO, R5 ; R4 = RO / 10 
MUL R1, R4, R5 ; R1 = R4 * 10 
SUB RR RO, R1 ; R2 = ( R0- (R0/10)*10) ， 即 个 位 
ADD 民力 0x30 ; 转换 成 ASCII〔( 因 为 R2 只 能 是 0-9) ， 亦 可 使 用 ORR 
STRB R2， [R3, #-1]! ; 把 ascii 字 符 送 进 缓冲 区 
MOVS Ro0, R4 ; RO = 商 ， 并 且 根 更 新 标志 位 以 检查 商 是 否 为 地 
BNE PutDecLoop ; 知 商 为 堆 ， 则 已 经 把 所 有 10 进 制 位 都 求 出 
MOV RO, R3 ; R0 指 回 文 本 缓冲 区 的 起 始 地 址 
BL Puts ; 使 用 Puts 显 示 结 
ADD SP， SP， #12 ; 恢复 sP 指 针 
POP {RO-R5, PC)} 子 程 返回 











怎么 样 ， 这 下 考官 得 黄 你 一 个 及 化 两 个 鸡 皇 了 吧 ! 如 果 读 者 还 看 过 不 使 用 乘除 法 指令 实现 该 子 
程 的 代码 ， 再 对 比 一 下 两 者 的 执行 速度 〈 基 至 能 相差 数 日 倍 )， 一 定 会 被 震 慨 到 ， 留 下 刻骨 铭 心 的 
记忆 的 。 
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10.6 使 用 数据 仔 依 器 


重 温 一 下 我 们 的 第 一 个 例子 : 在 我 们 做 到 程序 连接 这 一 步 时 , 我 们 手工 指定 了 读 / 写 区 的 位 置 。 
那么 我 们 该 如 何 把 数据 放 到 那里 昵 ? 正点 的 解决 方法 是 :在 汇编 源 文件 中 定义 一 个 相应 的 数据 区 。 
让 连接 器 把 数据 区 中 的 内 容 分 派 到 我 们 指定 的 位 置 一 一 从 9x2666_6666(SRAM 区 的 起 始 ) 处 开始 的 
内 存 。 

回顾 当时 使 用 的 连接 命令 : 


$> armlink --rw_base 0x20000000 --ro_base 0x0 --map -Oo testl.elf testl1.o 








STACK TOP EQU Ox20002000 SP 初始 值 ， 和 常数 


AREA |Header Code|, CODE 


we 





DCD STACK_TOP ; 栈 项 (MSP 的 ) 

DCD Start ; 复位 向 量 

ENTRY ; 指示 程序 从 这 里 开始 执行 
Start ; 主 程 序 开始 

; 初始 化 寄存 需 

MOV r0， #10 ; 加 载 循 环 变量 的 初 值 

MOV es #0 ; 初始 化 运算 结果 的 值 

; 计算 10+9+8+.. .+1 
loop 

ADD Le I ro0 ; R1 += RO 

SUBS Oy #1 ; R0 目 减 ， 并 且 根 据 结果 更 新 标记 (有 “Ss” 后 级 ) 

BNE loop ; if (RO!=0) goto loop; 

; 现在 ， 运 算 结 末 在 R1 中 

LDR r0; =MyDatal 

GTR ET [r0] ; 把 结果 存 入 MyDatal 
deadloop 

B deadloop ; 工作 完成 后 ， 进 入 无 穷 循 环 

;定义 数据 区 

AREA | Header Data|, DATA 

ALIGN 4 
MyDatal 

DCD 0 ; Destination of calculation result 
MyData2 

DCD 0 


END ; 文件 结束 标记 
在 连接 阶段 ， 连 接 器 要 把 DATA 区 放 入 斌 / 写 存 储 嚣 中， 因此 MyDatal 的 地 址 束 将 是 我 们 指定 的 
Ox200600 060000。 


10.7 使 用 互 斥 访问 实现 信号 量 操作 


互 斥 访问 是 新 出 来 的 ， 并 且 专 门 用 于 信号 量 的 操作 中 。 最 币 见 的 用 途 ， 就 是 确 你 需要 互 斥 使 用 
的 共 圣 资源 只 被 一 个 任务 拥有 。 
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让 我 们 举 个 例子 。 记 DeviceALocked 是 一 个 位 于 内 存 中 的 RN 变量 ， 用 于 指示 设备 A 是 否 已 经 在 
使 用 中 。 任 何 一 个 任务 ， 知 欲 使 用 设备 A， 都 必须 先 检 查 这 个 变量 的 值 。 如 果 它 的 值 为 零 ， 则 表示 
设备 可 以 使 用 。 在 任务 获取 到 设备 A 后 , 它 要 把 DeviceALocked 的 值 改 为 1, 表示 设备 A 已 经 被 占用 。 
在 设备 A 使 用 完毕 后 ， 该 任务 通过 重新 清 零 DeviceALocked 来 释放 设备 A， 从 而 使 其 它 任务 可 以 使 用 
此 设备 。 

看 起 来 这 是 个 如 意 算 盘 。 不 过 可 否 想 过 ， 如 条 两 个 任务 都 想 访 问 设 备 A， 是 否 有 潜在 的 危险 ”? 
比如 , 在 任务 1 读 取 了 DeviceALocked 后 , 发 现 是 堆 于 是 准备 使 用 此 设备 , 但 还 没 来 得 及 把 它 改 为 1， 
就 不 巧 被 调度 器 切 出 (比如 ， 轮 转调 度 )， 然 后 调度 占 让 任务 2 执行 ， 于 是 任务 2 也 读 到 零 ， 从 而 它 
使 用 设备 A。 但 是 在 任务 2 在 用 完 设 备 A 之 前 ， 调 度 器 又 切 回 任 务 1。 由 于 任务 1 早先 读 回 来 的 是 零 ， 
所 以 它 认 为 设备 A 是 空闲 的 ， 于 是 使 用 设备 A， 这 时 就 违背 了 设备 A 必 须 互 斥 访 问 的 限制 ， 使 系统 出 
现 茶 乱 危 象 ! 如 果 设 备 A 是 台 打 印 机 ， 则 把 两 个 文档 的 内 容 打 在 了 一 起 ; 如 果 设 备 A 是 油门 控制 右 ， 
则 可 能 使 汽车 失控 或 起 火 ， 后 果 不 堪 设想 。 

为 避免 此 问题 ， 必 须 也 保证 DeviceALocked 的 互 斥 访问 。 回 顾 一 下 第 5 章 ，STREX 指 令 是 有 返回 
值 的 ， 指 示 访 问 是 成 功 还 是 被 “ 驶 回 ”。 接 上 例 ， 如 果 任 务 #1 和 任务 #2 都 使 用 STREX， 则 任务 #1 的 
STREX 将 被 驳回 一 一 返回 1， 从 而 任务 1 知道 这 期 间 已 经 发 生 了 很 多 事 ,设备 A 已 让 他 人 占有 ， 束 避免 
了 凌乱 危 象 。 互 帮 访 问 的 模式 图 如 图 16.3 所 示 。 


| 






































法 肥 互 斥 锁 互 斥 读 
读 取 互 斥 锁 比特 (e.g.. LDREX) 


尝试 失败 。 共 享 资 源 已 被 其 它 


页 比特 = 1? 
互 乒 锁 比特 任务 或 ISR 使 用 ， 须 稍 后 重 试 


使 用 互 斥 写 尝试 互 斥 写 
置 位 互 斥 锁 (e.g., STREX) 


尝试 失败 。 互 斥 锁 可 能 在 此 期 则 
已 经 被 其 它 任务 或 JSR 访 问 过 ， 
为 避免 束 乱 条 件 ， 须 稍 后 重 试 


STREX 的 返回 
值 是 零 吗 





成 功 得 到 共享 资源 ， 互 斥 锁 被 置 位 ， 
可 以 放心 地 使 用 共享 资源 了 
图 16.3 使 用 互 斥 访问 来 实现 信号 量 〈 互 斥 锁 ) 的 操作 
上 述 操作 可 通过 下 面 的 示例 代码 实现 。 理 解 的 关键 在 于 ， 如 条 互 斥 访问 监视 需 返 回 了 失败 的 状 
态 ，STREX 束 被 驶 回 。 此 时 ， 不 会 执行 写 操 作 ， 从 而 保护 了 互 奈 锁 在 访问 笋 试 失败 时 不 被 更 改 。 
LockDeviceA 
; 一 个 简单 的 函数 ， 演 示 如 何尝 试 钳 住 设备 A 
; 返回 值 ，R0=0 表 示 成 功 ，R0=1 表 示 失 败 
; 如 果 访 问 成 功 ， 则 将 把 DeviceALocked 的 值 改 为 1 
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PUSH (请 1 人 2 TR) 
TryToLockDeviceA 
LDR R11, =DeviceALocked 
LDREX  R2, [R1] ; 使 用 互 斥 读 来 标记 对 互 斥 锁 的 访问 
CMP = #0 ; 检查 是 否 已 被 锁 住 
BNE LockDeviceAFailed 
DeviceAIlsNotLocked 
MOV RO, #1 ; 准备 锁 住 设备 A 
STREX  R2, RO, [R1] ; 互 斥 与 
CMP R2, #0 
BNE LockDeviceAFailed ; STREX 失 败 ， 设 备 A 可 能 已 被 锁 


LockDeviceASucceed 


MOV RO, #0 ; 准备 返回 成 功 值 

POP {R1, R2, PC} ; 子 程序 返回 
LockDeviceAFailed 

MOV RO, #1 ; 准备 返回 失败 值 

POP i ; 子 程序 返回 





如 果 返 回 的 是 1， 则 为 了 避免 紊乱 和 危 象 ， 任 务必 须 重 试 。 在 单 处 理 机 系统 中 ， 互 斥 访问 主要 用 
在 ISR 与 主 程序 之 间 , 用 以 保护 它们 共享 的 ,并且 需 要 互 斥 访问 的 资源 (如 ， 一 块 内 存 ， 一 个 外 设 )。 
此 时 ， 引 起 互 斥 写 失 败 的 唯一 原因 ， 吏 是 在 谈 写 期 间 曾 啊 应 过 中 断 。 如 果 代 人 码 在 特权 级 下 运行 ， 还 
可 以 通过 设置 PRIMASK， 在 “测试 一 一 置 位 ”期 间 暂 时 把 中 断 给 招 了 。 

在 多 处 理 机 系统 中 ， 情 况 会 变 得 更 复杂 。 此 时 ， 除 了 本 机 的 中 断 ， 其 它 处 理 机 对 同一 块 内 存 的 
访问 也 可 以 使 互 斥 写 操作 失败 。 为 了 检测 到 其 它 处理 机 对 内 存 的 访问 , 总 线 系统 中 必须 加 入 一 个 “ 互 
斥 访 问 监视 ”的 硬件 基础 设施 。 它 负责 检测 在 互 斥 谈 写 期 间 ， 总 线 上 是 否 有 其 它 主 机 访问 了 互 斥 锁 
及 其 临近 的 “高 危 地 融 ” 事实 上 ， 在 绝 大 多 数 低 成 本 的 CM3 单 请 机 中 ， 都 只 包含 了 一 个 核 ， 因 此 无 
需 此 监视 器 。 

有 了 这 个 机 制 ， 我 们 束 可 以 确信 共 圣 资源 一 定 能 互 帮 地 使 用 ， 不 会 发 生 茶 乱 危 象 。 如 果 一 个 共 
享 资 源 在 多 次 尝试 时 依然 无 法 获取 ， 则 可 能 必须 放弃 对 此 资源 的 请 求 ， 有 可 能 先前 锁 住 该 资源 的 任 
务 已 经 骨 沉 了 。 


10.8 使 用 位 市 实现 互 斥 锁 操 作 


如 果 存 储 器 系统 支持 “锁定 传送 ”(1locked transfers)， 或 者 总 线 上 只 有 一 个 主机 ， 还 可 以 
使 用 CM3 的 位 带 功 能 来 实现 互 斥 锁 的 操作 。 通 过 使 用 位 带 ， 则 可 以 在 C 程 序 中 实现 互 斥 锁 ， 但 是 操作 
过 程 与 互 斥 访问 是 不 同 的 。 在 使 用 位 剖 来 做 资源 分 配 的 控制 机 制 时 ， 需 要 使 用 位 带 存储 区 的 内 存单 
元 〈 比 如 ， 一 个 字 )， 该 内 存单 元 的 每 个 位 表示 资源 正 被 特定 的 任务 使 用 。 

在 位 带 别 名 区 的 读 写 实质 上 是 锁定 的 “ 读 - 改 - 写 ”( 在 传送 期 间 总 线 不 能 被 其 它 主 机 占有 )。 
此 ， 只 要 每 个 任务 都 仅 修 改 分 配给 它们 上 自己 的 锁定 位 ， 其 它 任务 锁定 位 的 值 就 不 会 丢失 ， 即 使 是 两 
个 任务 同时 写 自 己 的 锁定 位 也 不 怕 ， 如 图 16.4 所 示 。 
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共享 资源 的 互 斥 锁 变量 
ds3 人 人 
任务 2 
、 任务 1 
该 变量 的 每 个 位 都 对 应 任务 0 
一 个 任务 ， 指 示 该 任务 
锁 住 了 这 个 共享 资源 
资源 已 经 被 锁定 ， 
T 必须 稍 后 重 试 
使 用 位 带 别名 操作 ， 试 图 锁 住 自己 
对 应 的 锁定 位 
再 次 读 取 资源 锁 的 整个 变量 ， 术 
有 其 它 任 务 的 锁定 位 也 置 位 了 
有 另外 的 任务 或 者 处 
只 有 自己 设置 理 机 也 锁 住 了 该 资源 使 用 位 带 别 名 操作 ， 清 除 自 
的 位 是 1 吗 ? N ， 此 时 进入 “ 瞬 态 京 ”一 -| 己 的 锁定 位 ,放弃 本 次 对 共 
Y 乱 ” 条 件 享 资源 锁定 的 尝试 
成 功 锁 住 资 源 
10.4 ”使 用 位 带 实 现 瑟 日 斥 锁 的 工作 流程 图 
从 图 16.4 我 们 可 以 看 出 ,位 市 操作 有 可 能 使 共 孚 资源 在 一 个 短期 内 和 被“ 多重 锁定 ”>， 从 而 有 “了 瞬 








态 素 乱 ”。 但 是 它 不 会 造成 危害 ， 因 为 任务 一 定 能 检测 到 这 个 神 突 ， 从 而 杰 放 目 己 的 锁 。 

其 实 ， 对 于 “测试 并 设置 ”这 种 互 斥 锁 的 简单 操作 ， 也 可 以 使 用 “关中 临界 区 ”来 保护 一 一 也 
就 是 在 操作 前 关中 断 ， 换 作 后 开 中 靳 。 这 种 关中 的 时 间 是 很 得 的 ， 因 为 其 它 原 因 导 致 的 关中 通 各 都 
比 这 个 长 得 多 。 只 是 有 时 为 了 无 限 退 求实 时 性 ， 有 一 丝 布 望 也 会 尽 最 大 的 努力 ， 恕 像 这 两 种 互 斥 锁 
操作 那样 。 


10.9 使 用 位 段 提取 与 但 表 跳 转 


在 第 4 草 中 ， 我 们 考 宗 了 位 段 提 取 指 令 〈UBFX) 和 碍 表 跳 巷 指 令 〈TBB/TBH)。 这 两 条 指令 可 以 
配合 工作 ， 以 构建 一 个 非常 强大 的 “ 跳 苞 树 ”。 这 对 于 电表 及 数据 通信 应 用 程序 非 铅 县 义 ， 音 使 
这 类 程序 得 到 戏剧 般 地 优化 。 这 类 程序 在 工作 时 ,经 常 要 判断 各 种 各 样 的 情况 ， 并 且 “ 分 类 讨论 ”。 
有 时 ， 还 需要 进一步 细 化 ， 作 二 级 其 全 多 级 的 比较 判断 。 例 如 ， 下 图 束 演 示 了 一 个 “判决 树 ” 它 
根据 输入 量 A 的 各 位 段 编码 ， 来 决定 启动 的 任务 。 
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A[7:6] = 
执行 PO 

A[4:3] = 00 
执行 P2 

DecodeA 
LDR 
LDR 
UBEF'X 
TBB 

BrIliablel 
DCB 
DCB 
DCB 
DCB 

DecodeAl 
UBF'X 
TBB 

BrTiable2 
DCB 
DCB 
DCB 
DCB 

DecodeA2 
TST RO, 
BEQ P5 
B P6 

PO Ss 

El 

P22 vn 

I 

Pa ys 

Po sas 

EO 


A[7:0] 


00 /A A[7:6] = 01 


A[4:3] = 01 
执行 P3 
图 10.5 


R0 ,= 有 

RO, [RO] 
R1, RO, #6, #2 
[PC, R1] 


( (PO -~BrTiablel)/2) 

( (DecodeAl-BrTablel) /2) 
((P1 ~BrIiablel)/2) 

(( 

R1, RO, #3, #2 

[PC, R11] 


( (P2 -BrTable2 
( (P3 -BrTable2 
((P4 -BFTapbple2 
((P4 ~-BrTable2 


人 二 
DD DD DD 


#4 


DecodeA2-BrTablel1l)/2).， 


A[7:6] = 10 
执行 Pl 
A[4:3] = 1x 
执行 P4 


r 


r 


r 





从 内 存 中 读 取 A 的 值 

R1=RO [7:6] 

如 果 A[7:6] = 00 则 跳 至 P0 
如 果 A[7:6] = 

如 果 A[7:6] = 10 则 跳 至 P1 
如 果 A[7:6] = 10 则 跳 侍 DecodeA2 
R1=R0 [4:3]， 准 备 二 级 解码 
如 果 A[4:3] = 00 则 跳 至 P2 
如 果 A[4:3] = 01 则 跳 人 至 P3 
如 果 A[4:3] = 10 则 跳伞 P4 
如 果 A[4:3] = 11 则 也 跳 至 P4 


只 需 检 测 一 个 位 ， 因 此 无 需 UBEX 


PO 
Pl 
P2 
P3 
P4 
PS 
P6 











A[7:6] = 11 


A[2]=0 


执行 P5 


通过 各 位 段 编码 决定 操作 的 判决 树 示例 


第 16 章 


A[2] =1 


执行 P6 


01 则 踏 至 DecodqeA1L， 继 续 解 伍 





看 ， 如 末 使 用 C 来 号 这 个 这 个 程序 ， 则 需要 使 用 授 套 的 switch 和 大 量 的 位 操作 ， 可 现在 却 干 兆 
利沙 得 如 此 更 快 ! 如 果 跳 转 目 标 更 远 ， 可 以 使 用 TBH 指 令 。 
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玩 转 异 常 系统 


@ 使 用 中 断 

@ 卉 单 / 中 靳 服务 例 程 

@ 软件 中 断 

@ 开 利 服务 例 程 的 示范 

@ 使 用 SVC 

@ SVC 不 范 : 用 于 输出 数据 的 函数 
@ 在 C 中 使 用 SVC 


NMI, Faults, SVC, PendSV, IRQ #0, IRQ #1，.……: 

自动 栈 操作 、 向 量 式 、 抢 占 、 咬 尾 、 上 晚 到 ……… 

CM3 把 “中 断 / 异 常 ”这 个 概念 捧 到 了 登峰造极 的 境界 ， 为 实时 系统 的 开发 垫上 了 那么 一 个 宽大 
的 肩 。 如 果 在 CM3 上 开发 却 不 能 善 用 这 炙手可热 的 能 力 ， 那 说 不 定 都 会 有 一 种 暴 珍 天 物 的 感觉 ! 


11.1 使 用 中 断 


任何 一 个 有 后 型 的 散 入 式 系统 ， 束 没有 不 使 用 中 靳 机 制 的。 在 CM3 中 ，NVIC 为 我 们 搞定 了 使 
用 中 断 时 的 很 多 例 行 任务 ， 如 优先 级 检查 、 入 栈 / 出 栈 、 取 办 量 等。 不 过 在 NVIC 能 行使 职能 之 前 ， 
还 需要 我 们 做 好 如 下 的 初始 化 工作 : 

@ 建立 堆栈 
建立 问 量 表 
分 配 各 中 断 的 优先 级 
使 能 中 断 


11.1.1 建立 堆栈 


当 开 发 的 程序 比较 人 徐 单 时 ， 可 以 从 头 到 尾 都 只 使 用 MSP。 这 时 ， 只 需要 保证 开 出 一 个 容量 够 大 
的 堆栈 ， 再 把 MSP 初始 化 到 其 顶 即 可 一 一 这 也 是 单片机 开发 最 常见 的 做 法 。 

堆栈 用 罕 是 非常 致命 的 错误 ， 必 须 非 稼 严肃 地 计算 安全 容量 。 在 计算 时 ， 除 了 要 计 入 最 深 函 数 
调用 时 对 堆栈 的 需求 ， 还 需要 判定 最 多 可 能 有 多 少 级 中 断 能 人 尽 。 一 个 罕 方 法 〈 但 是 很 保险 ) 是 假设 
每 个 中 断 都 可 以 人 藤 套 。 对 于 每 一 级 般 套 的 中 断 ， 人 至 少 需要 8 个 字 (32 字 节 )， 而 且 如 果 ISR 过 于 复 
杂 ， 还 可 能 有 更 多 的 堆栈 需求 。 

因为 CM3 中 的 堆栈 是 以 “ 疝 下 生长 的 满 栈 ” 来 操作 SP 的 。 在 简单 的 场合 中 ， 经 常 可 以 把 SP 初 
始 化 为 SRAM 的 末尾 ， 这 么 一 来 孢 使 所 有 的 罕 亲 内存 都 能 为 堆栈 所 用 一 一 反正 不 用 电 不 用 ， 用 了 也 
白 用 ， 如 图 11.1 所 示 。 
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当前 堆栈 用 量 
曾经 的 堆栈 用 量 
堆栈 使 用 最 多 时 的 边界 


MSsP 初 始 值 


存储 刁 地 址 





~ 各 种 数据 段 


pe 
| 可 供 堆栈 使 用 的 





图 10.1 简单 程序 中 由 型 的 存储 部分 配 





从 图 中 我 们 可 以 看 出 ， 这 种 分 配方 式 能 给 堆栈 区 留 下 最 大 的 容量 一 一 所 有 剩余 内 存 ， 而 有 省 事 
义 省 心 一 一 省 去 了 令 人 头痛 的 堆栈 需求 计算 了 。 

然而 , 对 于 比较 大 型 的 或 者 是 有 员 性 能 指标 的 姐 入 式 系 统 , 往往 需要 两 个 堆栈 配合 使 用 。 这 时 ， 
就 只 好 勇敢 地 面 对 。 必 须 保 证 各 堆栈 都 有 足够 的 容量 ， 尤 其 是 主 堆栈 ， 最 容易 栽 在 它 上 面 。 要 注意 
的 是 ， 进 程 扒 栈 除 了 要 满足 本 进程 的 最 大 需求 量 ， 还 需要 扳 外 留 出 8 个 字 ， 用 于 容纳 第 一 级 中 断 时 
被 你 护 的 寄存 俘 。 

( 译 者 添加 〉 事实 上 ， 准 确 计算 主 堆 栈 需 求 往往 是 不 可 能 的 任务 ， 也 容易 过 于 保守 而 浪费 宝贵 的 血液 资源 。 在 
调试 阶段 时 ， 最 好 先 选 用 内 存 更 大 点 的 器 件 ， 然 后 开 出 足够 大 的 内 存 给 主 堆栈 。 然 后 在 调试 程序 时 ， 人 允许 随时 把 主 
堆栈 曾经 的 最 大 用 量 输 出 〈 通 过 调试 串口 或 仿真 器 等 )， 这 样 时 间 长 了 就 能 估算 对 主 堆栈 的 需求 ， 正 如 图 16.1 中 边 
界 的 作用 。 


11.1.2 建立 向 量 表 


如 果 在 程序 执行 的 从 头 到 尾 ， 都 只 给 每 个 中 断 提 供 固定 的 中 断 服务 例 程 〈 这 也 是 目前 单片机 开 
发 的 绝 大 多 数 情况 )， 则 可 以 把 向 量 表 放 到 ROM 中 。 在 这 种 情况 下 不 需要 运行 时 重建 问 量 表 。 然而 ， 
如 果 想 让 上 自己 的 设备 能 随机 应 变 地 对 付 各 种 复杂 情况 ， 就 单单 需要 动态 地 改变 中 断 服 务 例 程 ， 更 新 
向 量 表 就 是 必需 的 了 。 此 时 ， 向 量 表 必 须 被 转移 到 可 读 写 存储 器 中 《〈 如 内 存 )。 

在 把 问 量 表 重 定位 之 前 ， 往 往 要 把 现 有 的 癌 量 表 往 新 的 位 置 复制 一 份 。 需 要 拷贝 的 癌 量 主要 是 
系统 异常 的 服务 例 程 ， 如 各 种 fault 的 、NMI 的 以 及 SVC 的 等 等 。 如 果 没 有 建立 好 这 些 辣 量 就 局 用 
了 新 的 问 量 表 ， 束 可 能 会 在 啊 应 异常 时 把 不 可 预料 的 地 址 取出 ， 程 序 极 有 可 能 跑 飞 。 

当 我 们 把 所 有 必要 的 同 量 都 填 好 后 ， 束 可 以 启用 了 新 的 同 量 表 了 。 然 后 继续 往 里 面 加 入 新 的 中 
汤 问 量 ， 例 如 : 






















































































; 该 子 程序 根据 寞 第 类 型 建立 相应 的 异 第 问 量 
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; 对 于 IRO， 开 单 号 = 中 断 写 +16 

; 入 口 条 件 : R0= 异 常 类 型 编号 

; 入 口 条 件 : R1= 回 量 地 址 

PUSH {R2, LR} 

LDR 攻关 =0xE000ED08 ; 问 量 表 偏 移 量 寄 存 器 的 地 址 

LDR R2, [R2] ; 获取 问 量 表 的 首 地 址 

SM R1, [RZ2, RO Ler $2 ; 在 vectTb1loffset+ExcpTypex4 处 写 入 向 量 


; ExcpTIype*4 
POP {R2, PC} ; Return 


11.1.3 建立 中 断 优 乞 级 


在 复位 后 ， 对 于 所 有 优先 级 可 编程 的 异 第 ， 其 优先 级 都 被 初始 化 为 9。 而 对 于 NMI 和 便 fau1lt， 
由 于 它们 要 在 危难 之 际 手 喘 而 出 ， 所 以 把 它们 的 优先 级 定 死 为 -2 和 -1 (局 于 任何 其 它 弄 常 )。 在 编 
程 优 先 级 寄存 费时 ， 我 们 可 以 利用 它们 能 按 凶 节 访问 的 好 处 ， 以 便 化 程序 代码 ， 如 : 











; 把 IRO #4 的 优先 级 设 为 0xc0 





LDR RO, =0xE000E400 ; 加 载 外 部 空 优 先 级 寄存 器 阵列 的 起 始 地 址 
LDR R1, =0xCO ; 优先 级 
STRB RL [RO, #4] ; 为 IRQ #4 设置 优先 级 ( 按 字 节 写 ) 





在 CM3 中 ， 人 允许 使 用 3 个 位 到 8 个 位 来 表达 优先 级 。 为 了 确定 具体 的 位 数 ， 可 以 先 往 一 个 优先 级 
寄存 器 中 写 g6xFF， 再 谈 回 来 ， 谈 出 多 少 个 L1， 束 表示 使 用 多 少 个 位 来 表达 优先 级 ， 如 下 所 示 〈 下 段 
代码 演示 了 RBIT 配 CLZ 的 绝技 ): 

; 检测 系统 使 用 多 少 个 位 来 表达 优先 级 








LDR RO, =0xE000E400 ; 加 载 IRO #0 的 优先 级 配置 寄存 器 

LDR R1, =0xFF 

STRB Ri [RO] 要 守 败局 ;号 入 QE 

LDRB RL [RO] ; 读 回 (如 果 是 3 位 ， 则 应 读 取 回 0xE0) 

RBIT R2, R1 ; 反 转 ， 使 之 以 LSB 对 齐 

CLZ R1, R2 ; 计算 前 导 零 个 数 〈 例 如 ， 如 果 是 3 个 1 则 返回 5) 
MOV 2 #8 

SUB 区 R2 ， R1 ; 得 到 表达 优先 级 的 位 数 

MOV R1, #0x0 

STRB R1, [RO] ; 存储 结 








如 条 程序 可 能 要 路 需 件 移 西 《第 见于 比较 底层 的 基础 设施 函数 )， 那 么 最 好 只 使 用 最 高 3 个 有 效 
位 ， 对 应 的 优先 级 为 : 86x686，68x26，6x46，6x686，6x896，6xA6，68xC8 以 及 96xE6。 上 所 有 的 CM3 世 
片 都 一 定 文 持 3 个 位 表达 的 优先 级 。 

还 要 提醒 的 是 ， 不 要 忘记 为 系统 异常 〈 包 括 faults) 建立 优先 级 。 如 果 程 序 中 有 非常 紧急 的 外 
部 中 断 ， 它 们 甚至 需要 比 系统 异常 还 紧急 ， 可 是 却 因 故 不 能 连接 到 NMI 上 ， 就 要 把 系统 异常 的 优先 
级 调 低 ， 才 能 保证 紧急 的 中 断 能 够 抢占 系统 异 篆 ， 从 而 不 被 延 误 。 


11.1.4 使 能 中 淅 


在 问 量 表 与 优先 级 部 建立 好 后 ， 束 到 了 最 后 一 步 : 开 中 断 的 时 候 了 。 
然而 ， 在 打开 中 断 乙 前 ， 可 能 还 有 两 个 步 又 不 能 省 略 : 
1， 如 末 把 癌 量 表 重 定位 到 了 RAM 中 ， 且 这 块 RAM 所 在 的 存储 豆 区 域 是 与 缓冲 的 ， 回 量 更 新 了 惑 可 能 被 
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延迟 。 为 了 以 防 万 一 ， 必 须 在 建立 完 所 有 癌 量 后 退 加 一 条 “数据 同步 隔离 (DSB)” 指 令 〈 见 第 4 

章 )， 以 等 待 缓冲 写 入 后 再 继续 ， 从 而 确保 所 有 数据 都 已 落实 。 

2. 开 中 断 前 可 能 已 丝 有 中 断 县 起， 或 者 请 求 信 号 有 效 了 ， 这 往往 是 不 可 预料 的 。 比 如 ， 在 上 电 期 

间 ， 信 和 号 线 上 有 发 生 过 毛刺 ， 就 可 能 会 被 意外 地 判定 成 一 次 中 断 请 求 脉冲 。 另 外 , 在 某 些 外 设 ， 

如 UART， 在 串口 连接 瞬间 的 一 些 噪音 也 可 以 被 误 判 为 接收 到 的 数据 ， 从 而 使 中 断 被 上 甚 起 。 

在 NVIC 中 进行 中 断 的 使 能 与 除 能 时 ， 都 是 使 用 各 日 的 宫 存 器 阵列 (SETENA/CLRENA) 来 完成 的 : 
通过 往 适 当 的 位 写 1 来 发 出 命令 ， 而 写 6 则 不 会 有 任何 效果 。 这 就 让 每 个 中 断 都 可 以 自 顾 地 使 能 和 除 
能 ， 而 不 必 担 心 会 破坏 其 它 中 断 的 设置 。 这 改变 了 以 前 必须 “ 读 - 改 - 写 ”的 三 步 曲 ， 从 而 在 根本 上 
消灭 了 在 此 地 产生 北 乱 和 危 象 的 可 能 ; 否则， 必须 使 用 互 斥 访问 等 机 制 来 完成 修改 。 下 例 残 演示 了 通 
过 置 位 SETENA 中 的 位 来 使 能 中 断 ， 通 过 置 位 CLRENA 中 的 位 来 除 能 中 断 : 

1. 使 能 中 断 
; 根据 IRo 号 来 使 能 中 断 的 子 程序 





























EnableIRO 
; 入 口 条 件 : RO0= 中 断 号 
PUSH {RO-R2, LR} 
AND.W R11, RO, #0x1F ; 为 该 ITRo 产 生 移 位 量 
MOV 这， #1 
I R2， R2 ， R1 ; 位 旗 标 = (0xl << (N & 0xlF)) 
AND.W R11, RO #0xEO ; 在 IRO 编 号 >31 则 为 它 生 成 下 标 偶 移 量 
LSR RL R1, #3 ; 地 址 偏 移 量 = (N/32)*4【〔 每 个 IRQ 一 个 位 ) 
LDR RO, =0xE000E100 ; 加 载 SETENR 寄 存 器 阵列 的 首 地 址 
STR R2, [RO, R1] ; 写 入 该 中 断 的 位 旗 标 ， 从 而 使 能 该 中 断 
POP {RO-R2, PC)} ; 子 程 返回 


2. 除 能 中 电 
几乎 是 照抄 上 一 个 例 程 ， 就 得 到 了 对 应 的 除 能 中 断 的 子 程序 : 


DisableIRO 
; 入 口 条 件 : Ro= 中 上 断 号 
PUSH [RO=R2, LTR] 
AND.W Rl, RO, #0x1F ; 为 该 IRO 产 生 移 位 量 
MOV R2, 和 
Ear RR R2, R1 ; 位 旗 标 = (0xl << (N & 0xlF)) 
AND.W Rl, RO, #0xE0 ; 大 IRQ 编 写 >31 则 为 它 生 成 下 标 仿 移 量 
DSR 廊下 ， 六 全。 #3 ; 地 址 偏 移 量 = (N/32)*4【〔 每 个 IRQO 一 个 位 ) 
LDR RO, =0xE000E180 ; 加 载 CLRENA 寄 存 器 阵列 的 首 地 址 
STR 民 [RO, R1] ; 写 入 该 中 断 的 位 旋 标 ， 从 而 除 能 该 中 断 
POP {RO-R2, BC ; 子 程 返回 


访问 NVIC 寄 仓 器 的 小 贴 十 

在 NVIC 中 ， 绝 大 多 数 寄存 器 都 可 以 按 字 / 半 字 / 字 节 的 形式 访问 。 对 于 不 同 的 场合 ， 
应 灵活 使 用 适当 的 形式 ， 以 简化 程序 的 开发 。 比 如 ， 对 优先 级 寄存 器 的 按 字 节 访问 ， 就 
消除 了 按 字 / 半 字 访 问 时 ， 需 要 “ 读 - 改 - 写 ” 的 序列 (为 的 是 不 影响 其 它 中 断 的 优先 级 )。 
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11.2 寞 昔 / 中 断 服 务 例 程 


在 CM3 中 ,中断 服务 例 程 可 以 纯 用 Cc 来 写 。 与 ARM7 的 情况 相 比 ， 后 者 则 往往 需要 首尾 都 加 以 汇编 
封皮 ， 用 以 保证 所 有 寄存 融 部 保护 了 。 为 外 ， 在 中 断 租 侠 时 ， 处 理 右 需要 切换 到 为 外 的 模式 ， 以 防 
止 信息 丢失 。 这 上 坚 拖 跨 系 统 实时 性 和 市 来 入 门 难度 的 索 文 组 下 在 CM3 中 都 被 消灭 了 ， 使 得 编程 时 个 
心 很 多 。 

如 朱 用 汇 纺 来 号 ISR， 其 上 骨架 看 上 去 差不多 如 下 所 未: 
irqdql handler 

; 处 理 中 晰 请 求 




















; 消除 在 设备 中 的 IRQ 请 求 信和 号 


; 中 断 返 回 

BX LR 

如 果 ISR 迪 辑 比 较 复杂 ， 则 党 汕 需要 更 多 的 寄存 右 ， 这 时 束 要 启用 R4-R11 了 。 但 是 它们 不 是 CM3 
目 动 入 栈 的 , 所 以 使 用 前 必须 手工 PUSH。 下 一 个 例子 演示 一 个 保险 的 容 方 法 : 保护 了 所 有 的 寄存 占 。 
其 实 如 条 内 存 够 用 ， 使 用 罕 方 法 作为 起 点 也 不 失 为 一 个 不 错 的 主意 ， 等 到 日 后 优化 程序 时 再 去 把 没 














有 使 用 的 寄存 堪 。 
irql handler 
PUSH {R4-R11, LR)} ; 保存 所 有 可 能 用 到 的 ， 又 没有 被 自动 入 栈 的 寄存 器 


; 处 理 中 晰 请 求 
; 消除 在 设备 中 的 IRO 请 求 信号 


; 中 断 返 回 





POP {R4-R11, PC} 
因为 PoP 也 是 局 动 中 断 返 回 的 一 条 途径 ， 所 以 我 们 把 寄存 右 出 栈 与 中 汤 返 回合 并 在 一 条 POP 中 ， 
使 程序 更 精练 。 


有 些 外 设 的 中 断 请 求 信号 需要 ISR 手 工 清 除 , 如 : 外 设 的 中 断 请 求 是 持续 的 电 平 信号 一 一 显然 ， 
对 于 和 纵 即 逝 的 脉冲 型 的 请 求 ， 是 无 需 手 工 清除 的 。 奋 电 平 型 中 断 请 求 没 有 清除 ， 则 中 断 返 回 后 将 
再 次 触发 已 经 服务 过 的 中 断 。 以 前 在 ARM7 中 ， 外 设 必 须 使 用 这 种 “ 电 平 保持 ”的 方式 bs]， 直 到 中 
灶 被 啊 应 ， 因 为 那个 时 候 的 中 断 控 制 右 没有 保存 葵 起 状态 。 在 CM3 中 就 解决 了 这 个 问题 ， 只 要 检测 
到 过 曾经 出 现 的 中 断 请 求 , NVIC 就 会 记 住 它 , 因此 便 件 只 需 给 一 个 脉冲 , 无需 再 一 直 保 持 请 求 电 平 ， 
持续 的 电 平 反而 成 为 一 种 讨厌 的 事 了 。 而 且 当 其 服务 例 程 得 到 执行 时 ，NVIC 目 动 把 从 起 状态 清除。 
对 于 这 种 情况 ， 就 不 必 在 ISR 中 软件 清除 请 求 信号 了 。 

译注 ; 很 多 厂家 都 在 设计 ARM7 心 厂 时 添加 了 目 己 的 中 断 控制 占 ， 这 些 中 断 控制 占 也 党 第 能 记 住 请 求 脉 冲 。 


11.3 软件 触 友 中 断 


触发 中 断 有 多 种 方法 : 

@ 外 部 中 断 输入 

@ 设置 NVIC 的 县 起 寄存 器 中 设置 相关 的 位 《第 8 章 ) 
@ ”使 用 NVIC 的 软件 触发 中 断 寄 存 器 (STIR)〈( 第 8 章 ) 
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系统 中 总 是 会 有 一 些 中 断 没有 用 到 ， 此 时 融 可 以 当 作 软件 中 断 来 使 用 。 软 件 中 断 的 功用 与 SVC 
类 似 ， 两 者 都 能 用 于 让 任务 进入 特权 级 下 ， 以 获取 系统 服务 。 不 过 ， 大 要 使 用 软件 中 断 ， 必 须 在 初 
始 化 时 把 NVIC 配 置 与 控制 寄存 器 的 USERSETMPEND 位 置 位 ， 否 则 是 不 允许 用 户 级 下 访问 STIR 的 〈 附 
录 D 的 表 D.17 有 该 寄存 占有 的 详细 说 明 )。 

但 是 软件 中 断 没 有 SVC 专 业 : 比如 ,它们 是 不 精确 的 ， 也 就 是 说 ,抢占 行为 不 一 定 会 立即 发 生 ， 
即使 当时 它 没 有 被 掩蔽 ， 也 没有 被 其 它 ISR 阻 塞 ， 也 不 能 保证 马上 响应 。 这 也 是 写 缓冲 造成 的 ， 会 
影响 到 与 操作 NVIC STIR 相 临 的 后 一 条 指令 ; 如 果 它 需要 根据 中 断 服 务 的 结果 来 决定 如 何 工 作 《〈 如 
条 件 跳 转 )， 则 该 指令 可 能 会 误 动 作 一 一 这 也 可 以 算是 紊乱 危 象 的 一 种 表现 形式 。 为 解决 这 个 问题 ， 
必须 使 用 一 条 DSB 指 令 ， 如 下 例 所 示 : 


MOV RO, #SOFTWARE INTERRUPT_ NUMBER 
























































LDR R1,=0xE000EFO0O ; 加 载 NVIC 软 件 触发 中 断 寄存 器 的 地 址 
ST RO, [R1] ; 触发 软件 中 断 
DSB ; 执行 数据 同步 隔离 指令 





那 是 否 这 样 就 万 事 大 吉 了 呢 ? 不 坟 的 是 ， 还 不 能 高 兴 得 太 早 ， 因 为 还 有 男 一 个 隐患 如 果 欲 触 
发 的 软件 中 断 被 除 能 了 ， 或 者 执行 软件 中 断 的 程序 自己 也 是 个 异常 服务 程序 ， 软 件 中 断 就 有 可 能 
法 响应 。 因 此 ， 必 须 在 使 用 前 检查 这 个 中 断 已 经 在 响应 中 了 。 为 达到 此 目的 ， 可 以 让 软件 中 断 服务 
程序 在 入 口 处 设置 一 个 标志 。 

最 后 要 注意 的 是 ， 虽 然 是 出 于 好 心 置 位 USERSETMPEND， 但 容易 烧香 引出 鬼 来 :因为 用 户 程序 
可 能 会 以 软件 的 方式 触发 任何 一 个 中 断 ， 制 造 出 各 种 “假象 ” 如果 系 统 中 包含 了 不 受信 任 的 用 户 
程序 ， 就 必须 全 体 接 种 疫苗 一 一 每 个 异常 服务 例 程 都 必须 检查 该 异常 是 否 允 许 。 其 实 ， 通 向 天 党 是 
有 路 的 一 一 干 嘛 不 用 更 专业 的 SVC 来 实现 系统 服务 呢 ? 


11.4 异 单 服务 例 程 的 汉 例 


回忆 第 7 章 ， 我 们 曾 提 到 ,不 管 应 用 程序 多 简单 ， 都 必须 在 同 量 表 中 包含 下 列 三 项 : 复位 问 量 、 
NMI 问 量 以 及 使 fault 癌 量 ， 这 是 因为 后 两 者 无 需 使 能 网 可 以 及 生 。 在 程序 运行 后 ， 有 时 还 会 把 问 量 
表 重 定位 的 SRAM 中 。 下 和 面 束 汗 示 一 种 重 定 位 的 情况 : 把 同 量 表 转 移 到 SRAM 的 起 始 处 ， 并 且 在 它 的 后 
面 定义 数据 区 一 一 存储 各 种 全 局 和 静态 变量 。 程 序 有 点 长 ， 但 很 多 部 分 以 前 都 抑 过 了 ， 不 要 介 ! 







































































STACK_ TOP EQU 0x20002000 ; MSP 初 始 值 

NVIC_SETEN EQU OxE000E100 ; SETENA 寄 存 器 阵列 的 起 始 地 址 
NVIC_VECTTBL EQU 0xE000ED08 ; 问 量 表 偏 移 寄 存 右 的 地 址 
NVIC_AIRCR EQU OxE000EDOC ; 应 用 程序 中 断 及 复位 控制 寄存 器 的 地 址 





NVIC_IROPRI EQU 0xE000E400 ; 中 断 优先 级 寄存 喜 阵 列 的 起 始 地 址 


AREA | Header Code|, CODE 


DCD STACK_TOP ; MSP 初 始 值 

DCD Start ; 复位 问 量 

DCD Nmi Handler ; NMI 服 务 例 程 
DCD Hf_Handler ; 便 fault 服 务 例 程 
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ENTRY 
Stast ; 主 程序 开始 

; 初始 化 各 寄存 器 

MOV Os #0 

MOV 和 | #0 


; 把 各 个 癌 量 找 贝 到 新 向 量 表 中 








LDR pO, =0 

LDR rl, =VectorlTableBase 

LDMIA. TOL {P20 ; 揽 贝 4 个 字 (CMSP，Reset，NMI， 便 fault) 
STMIA rill!, {Ir2—r5} 

DSB ; 数据 同步 隔离 

; 执行 向 量 表 重 定位 : 

LDR ro, =NVIC_ VECTTBL 

LDR a ls =VectorTlableBase 

STR Eo [r0] 


; 设置 优先 级 组 寄存 器 ， 划 分 抢占 优先 级 与 亚 优 先 级 


LDR 0; =NVIC_AIRCR 
LDR EE =0x05FA0500 ; 从 位 5 处 划分 ( 共 2 个 位 表达 抢占 优先 级 ) 
STR R1, EEO 
; 建立 IRQ0 的 问 量 
MOV ro, #0 ; IRQ#0 
LDR rl1, =Irg0_Handler 
BL SetuplrgqHandler 
; 建 六 IRQ #0 的 优先 级 
LDR EO =NVIC IRQOPRI 
LDR 0 =0xC0 ; IRQ#0 的 优先 级 
STRB rl, [r0, #0] ; 写 入 优先 级 寄存 器 中 ， 用 了 按 字 节 传 这 
DSB ; 数据 同步 隅 离 ， 保 证 开 中 断 前 一 切 部 已 各 就 各 位 
MOV EO #0 ; 选择 IRQO #0 
BL EnableIRO 
; 各 函数 
SetuplrqHandler 


; 入 口 条 件 : RO = IRo 编 号 
; 入 口 条 件 : R1 = IRQ8 服 务 例 程 的 入 口 地 址 








PUSH {RO, R2, LR} 

LDR R2, =NVIC_VECTTBL ”; 获取 向 量 表 的 地 址 

LDR R2, [R2] 

ADD RO, #16 ; 异常 号 = IRQ 编 号 + 16 
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于 RO, RO, #2 ; 乘 以 4 (每 个 同 量 4 学 市) 
ADD R2， RO ; 找 出 回 量 地 址 
STR R1, [R2] ; 写 入 服务 例 程 
POP {RO, R2, PC} ; 返回 

EnableIRO 
; 入 口 条 件 :R0= 中 靳 号 
PUSH {RO-R2, LR} 
AND.W Rl1, RO, #0x1F ; 为 该 IRQO 产 生 移 位 量 
MOV R2， 条 
ESE R2， 民 六 ， R1 ; 位 旗 标 = (0xl << (N & 0x1F) ) 
AND.W Rl, RO, #0xEO ; 若 IRQ 编 写 >31 则 为 它 生 成 下 标 偏 移 量 
LSR RL Rs #3 ; 地 址 偏 移 量 = (N/32)*4【 每 个 IRO 一 个 位 ) 
LDR RO, =NVIC_SETEN ; 加 载 SETENA 寄 存 右 阵列 的 目地 址 
STR R2， [RO, R1] ; 写 入 该 中 断 的 位 旗 标 ， 从 而 使 能 该 中 断 
POP {RO-R2, PC} ; 子 程 返回 


; 异常 服务 程序 
Hf_Handler 





; 在 此 添加 人 硬 fault 的 处 理 代码 
BX LR 
Nmi Handler 
; 在 此 添加 NMI 的 啊 应 代码 
BX LR 
Irgq0_Handler 
; 在 此 添加 IRQ #0 的 啊 应 代码 
BX LR ; Return 


AREA | Header Data|, DATA 





ALIGN 4 

; 重 定位 的 癌 量 表 
VectorTableBase SPACE 256 ; 保留 256 字 节 作 问 量 表 
VectorTableEnd ; (256 / 4 = 最 多 文 持 64 个 寞 党 ) 
MyDatal DOD 0 ; 定义 变量 
MyData2 DCD 0 


END ; 文件 结尾 





这 个 例子 是 长 了 点 ， 让 我 们 再 从 后 往 前 看 。 在 程序 的 尾部 ， 定 义 了 数据 存储 区 。 通 过 SPACE 沪 . 
编 指示 字 ， 我 们 为 同 量 表 开 出 了 256 字 节 的 内 存 空间 ， 从 而 可 以 容纳 64 个 异常 回 量 。 如 果 把 256 改 成 
列 的 数 ， 束 能 改变 癌 量 表 的 长 度 。 在 同 量 表 的 后 面 ， 还 定义 了 两 个 变量 。 第 一 个 变量 MyData1 双 换 
着 向 量 表 , 所 以 它 的 地 址 是 gex2666_ 6166, 第 - 个 MyData2 是 为 6x2666_ 6164.。 (不过, 通常 情况 下 ， 
强烈 反对 使 用 这 种 以 计算 的 方式 来 求 得 变量 地 址 。 因 为 很 容易 出 错 ， 而 且 只 要 以 后 再 新 插入 新 的 变 
量 定义 ， 则 所 有 插入 位 置 后面 的 变量 地 址 也 都 要 重新 计算 ， 因 为 它们 被 “ 拱 ” 到 后 面 去 了 一 一 译 者 
注 。 
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再 看 程序 的 起 涉 ， 在 那里 我 们 一 上 来 束 定 义 了 奎 干 个 地 址 常数 (NVIC 寄 存 占 的 地 址 )， 由 整个 
程序 使 用 。 通 过 使 用 一 个 有 意义 的 名 字 取 代 下 接 抄 地 址 ， 程 序 束 更 容易 理解 ， 也 减少 了 出 错 。 

在 初始 的 癌 量 表 中 ， 包 含 了 复位 癌 量 、NMI 癌 量 ， 以 及 便 fault 问 量 ， 它 们 是 三 要 素 。 后 面 的 代 
码 还 给 出 了 服务 例 程 的 骨架 。 在 开发 应 用 程序 时 ,必须 根据 程序 的 指标 来 实现 这 三 要 素 的 服务 例 程 ， 
不 可 和 省略。 

这 里 的 服务 例 程 都 是 使 用 BX LR 返回 的 ， 但 是 真人 到 了 写 程序 时 ， 人 往往 利用 POP 《...,PC} 的 形式 
来 使 程序 更 精练 (当然 也 可 以 使 用 LDMIA 指 令 )。 

进入 主 程序 后 ， 先 初始 化 寄存 器 ， 人 然后， 就 通过 LDM/STM， 把 向 量 一 次 多 个 地 拷贝 到 新 的 向 量 
表 中 。 如 果 后 来 又 添加 了 新 的 向 量 ， 则 可 以 在 LDM/STM 中 增加 数量 ,或 者 再 多 用 一 对 LDM/STM， 这 
些 都 是 很 简单 的 事 。 

在 准备 好 了 癌 量 表 后 ， 束 可 以 编程 NVIC， 启 用 新 的 问 量 表 了 。 但 是 在 启用 前 ， 为 了 保证 在 问 量 
捞 贝 都 完成 后 才 做 下 一 步 ， 我 们 还 用 了 DSB 指 令 来 隅 离 。 

接 下 来 继续 做 与 中 断 设置 相关 的 工作 ， 第 一 个 束 是 建立 优先 级 组 。 

这 些 初 始 化 都 是 一 过 水 选 的 。 本 例 中 ， 使 用 了 两 个 子 程 序 来 完成 中 靳 的 建立 ， 从 而 使 程序 结构 
更 清晰 。 其 中 SetupIrqHandler 负 责 在 向 量 表 建立 中 断 服 务 例 程 的 入 口 地 址 ， 而 EnableIRQ 则 用 于 
在 NVIC 中 使 能 一 个 中 断 。 在 为 一 个 中 断 建立 好 优先 级 后 ， 驶 可 以 使 能 它 。 如 果 还 需要 除 能 中 断 ， 则 
可 以 照 期 芒 男 款 地 就 能 当场 造 出 一 个 DisableIRQ 来 ， 只 是 SETENA 改 成 了 CLRENA。 





















































11.5 使 用 SVC 





SVC 是 用 于 呼叫 0S 所 提供 API 的 正道 。 用 户 程序 只 需 知道 传递 给 0s 的 参数 ， 而 不 必 知 道 各 API 函 


数 的 地 址 。 
SVC 指 令 禹 一 个 8 位 的 立即 数 ， 可 以 视 为 是 它 的 参数 ， 被 封装 在 指令 本 和 喘 中 ， 如 : 
SC ; 呼叫 3 号 系统 服务 





则 3 被 封装 在 这 个 SVC 指 令 中 。 因 此 在 SVC 服 务 例 程 中 ， 需 要 读 取 本 次 触发 SVC 异 常 的 SVC 指 令 ， 
并 提取 出 8 位 立即 数 所 在 的 位 段 ， 来 判断 系统 调用 与 ， 工 作 流 程 如 11.2 所 示 : 
检测 LR.2， 以 检测 呼叫 


系统 服务 的 程序 使 用 的 
是 哪 一 个 堆栈 指针 










从 MspP 中 读 取 讨 入 的 
PC 





从 PsP 中 读 取 庄 入 的 PC 





根据 PC 获取 SVC 的 地 址 ， 
然后 从 SVC 指 令 中 提取 8 位 立即 数 





图 11.2 ”提出 SVC 中 立即 数 的 一 种 途径 
实现 上 图 功能 的 代码 如 下 所 示 : 
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TT LR, #0x4 ; 测试 EXC_RETURN 的 比特 2 

TT EQ x Os 

MRSEQ RO, MSP ; 则 使 用 的 是 主 堆栈 ， 故 把 MSP 的 值 取出 

MRSNE RO0, PSP ; 否则 ， 使 用 的 是 进程 堆栈 ， 故 把 MSP 的 值 取出 

LDR R1, [RO, #24] ; 从 栈 中 读 取 PC 的 值 

LDRB RO, R1,#=2] ; 从 SVvc 指 令 中 读 取 立即 数 放 到 RO 

; 准备 调用 系统 服务 函数 。 这 需要 适当 调整 入 栈 的 PC 的 值 以 及 LR (EXC_RETURN) ， 来 进入 os 内 部 
六 开展 ; 借 异 常 返 回 的 形式 ， 进 入 os 内 部 ， 最 终 调用 系统 服务 函数 








一 旦 获取 了 调用 号 ， 残 可 以 用 它 来 调用 系统 服务 函数 了 。 有 理由 相信 ，0s 应 该 使 用 TBB/TBH 奏 
表 跳 转 指 令 来 加 速 定 位 正确 的 服务 函数 。 然 而 , 如 果 你 是 设计 0S 的 人 , 必须 检查 这 个 参数 的 合法 性 ， 
以 免 因 数字 超出 跳 转 表 的 范围 而 跳 飞 。 

因为 不 能 在 SVC 服 务 例 程 中 上 般 套 使 用 SVC， 上 所 以 如 果 有 需要 ， 驳 要 和 直接 调 用 SVC 国 数 ， 例 如 ， 使 
用 BL 指 令 。 





11.6 SVC 示范 : 用 于 输出 遂 数 


在 本 和 面 的 例子 中 ， 我 们 与 了 夺 干 个 函数 用 于 输出 。 但 是 有 的 时 候 ， 可 能 有 一 些 障 但 ， 使 得 我 们 
不 能 用 BL 指令 。 例 如 ， 需 要 调用 的 函数 是 在 为 外 的 目标 文件 中 ， 这 束 会 叶 人 笃 有 的 时 候 我 们 无 法 定位 
子 程 序 的 入 口 地 址 ， 为 外 ， 如 果 跳 转 的 目的 地 太 远 ， 也 有 请 多 不 便 ; 或 者 ， 当 使 用 0S 时 ， 这 些 输 出 
半数 已 经 个 0S 包 涨 成 系统 调用 了 。 在 这 些 场 合 下 ， 我 们 就 需要 使 用 Svc 来 作为 传送 门 ， 如 下 和 耐 示例 






































代码 所 示 : 
LDR RO, =HELLO_TXT 
SVC 0 ; 请 求 显 示 字 符 串 的 系统 服务 。 服 务 代 号: 0 
MOYV RO, # A” 
SVC 1 ; 请 求 显 示 单 一 字符 的 系统 服务 。 服 务 代号 : 1 
LDR RO, =0xC123456 
SVC 2 ; 请 求 显示 16 进 制 数 的 系统 服务 。 服 务 代 写 : 2 
MOV RO, #1234 
SVC 3 ; Display decimal value in RO 


k 


el 








在 使 用 SVC 之 前 ， 我 们 需要 先 建 六 SVC 服 务 例 程 问 量 ， 作 法 与 建 六 IRQ 的 一 样 ， 只 是 需要 把 异 沼 
号 改 为 11。 这 一 次 ， 通 过 巧妙 地 使 用 Thumb-2 指 令 ， 我 们 还 可 以 进一步 优化 代码 : 
SetupExcpHandler 


; 入 口 条 件 ，R0 = 异常 号 

; 入 口 条 件 : R1 = 异常 服务 例 程 

PUSH {RO, R2, LR)} 

LDR 2 更 =NVIC_VECTTBL 

LDR 2 [R2] ; 读 取 癌 量 表 的 地 址 

STR.W Ri1, [R2, RO, LSL #2] ; 表 中 [R2+R0<<2] 的 位置 束 是 为 该 癌 量 的 
POP (ERO R22, Ee) ; 快速 返回 





对 于 SVC 服 务 例 程 ， 可 以 使 用 前 面 所 述 的 方式 提取 服务 代号 。 如 果 那 些 请 求 系 统 服务 的 程序 还 
传递 了 其 它 参 数 ( 通 过 Re@-R3), 则 需 找 出 正确 的 堆栈 , 再 从 堆栈 中 , 读 取 进入 SVC 时 目 动 压 入 的 R@-R3 
人 

一 个 具体 而 微 的 SVC 服 务 例 程 如 下 所 示 : 
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; 开始 恋 取 参数 

TST LR, #0x4 ; 测试 EXC_RETURN 的 比特 2 

下 了 站 EQ ; 如 果 为 0， 

MRSEQ RO, MSP ; 则 使 用 的 是 主 堆栈 ， 故 把 MSP 的 值 取出 
MRSNE RO, PSP ; 和 否则， 使 用 的 是 进程 堆栈 ， 故 把 MSP 的 值 取出 
LDR RO, [R1, #0] ; 从 堆栈 中 读 取 Ro 的 值 

LDR Ry [R1, #24] ; 从 堆栈 中 读 取 当时 的 PC 

LDRB 要 [R1, #—2] ; 提取 SVc 指 令 中 的 8 位 立即 数 

; 现在 : R0o 存 储 了 参数 ，R1 存 储 了 服务 代号 

PUSIH {LR} ; 保护 LR 的 值 ， 因 为 后 面 将 使 用 的 BL 指令 
CBNZ R1, svc_ handler 1 

BL Puts ; 调用 Puts 

B svc_handler_end 


svc handler 1 


CMP R1, #1 
BNE svc_ handler 2 
BL BE ; 调用 Putc 
B svc_handler_end 
svc_handler 2 
CMP R1, #2 
BNE svc_handler_ 3 
BL PutHex ; 调用 PutHex 
B svc_handler_end 
svc_ handler 3 
CMP R1, #3 
BNE svc_ handler 4 
BL PutDec ; 调用 PutDec 
B svc_handler_end 
svc_handler_4 
B error 7 未 能 识别 的 服务 代号 


svc handler _ end 


POP {PC} ; Return 


译 者 添加 : 事实 上 ， 根 据 具体 的 系统 ， 不 必 忆 是 教条 主义 ， 以 化 位 参数 提取 的 工作 。 比 如 ， 如 果 系 统 调用 的 参 
数 不 超 过 3 个 ， 束 可 以 把 系统 调用 号 存储 到 R@ 中 ， 把 参数 帮 到 R1-R3 中 ， 而 省 去 提取 服务 号 的 操作 。 
上 例 中 ， 需 要 把 svc_handler 的 代码 与 那些 输出 图 数 的 放 在 一 起 ， 以 确保 它们 能 在 跳 转 的 范围 





内 





细心 的 读者 可 能 会 问 : 为 什么 不 直接 从 Re@-R3 中 读 取 参数 ， 却 绕 个 大 疾 子 从 堆栈 中 读 取 取 呢 ， 
它们 不 是 一 样 的 么 ?原来 ， 这 与 昂 到 中 断 机 制 有 有 天。 仔细 地 想 一 想 ， 如 果 在 入 栈 期 间 ， 不 巧 来 了 力 
外 的 高 优先 级 异常 ， 则 会 使 后 者 的 服务 例 程 先 执行 。 街 返回 后 ， 再 以 咬 尾 中 断 的 方式 执行 SVC 服 务 
例 程 。 我 们 知道 ， 咬 尾 处 理 时 ， 取 消 了 前 一 个 服务 例 程 返 回 时 的 目 动 出 栈 动作 。 从 而 ， 在 及 生 了 有 晚 
到 + 咬 尾 的 情况 后 ， 再 执行 SVC 服 务 例 程 时 ，R@-R3 已 经 被 高 优先 级 的 服务 例 程 用 过 了 ， 它 们 的 值 十 
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有 八 九 被 改过 的 。 因 此 ， 必 须 从 堆栈 中 读 取 。 为 帮助 理解 ， 在 这 里 举 一 个 有 具体 的 例子 : 

1 用户 程 序 把 参数 放 到 Re 中 ， 并 执行 SVC 指 令 ， 请 求 系统 服务 

2. CM3 为 SVC 开 启 了 异常 的 响应 序列 ， 开 始 自 动 入 栈 ， 即 把 xPSR，PC，LR，R12，R3-R8 压 入 堆栈 

3。. 入 栈 期 间 ， 来 了 一 个 高 优先 级 的 中 断 

4. 入 栈 完毕 后 , 按 晚 到 中 断 处 理 ， 先 执行 高 优先 级 中 断 的 服务 例 程 。 返回 后 ,， 再 以 咬 尾 中 断 处 理 ， 
此 时 ， 没 有 目 动 出 栈 的 动作 。 

5。 SVC 服 务 例 程 以 咬 尾 的 方式 开始 执行 。 可 见 ， 此 时 的 Re 已 经 被 高 优先 级 服务 例 程 用 过 了 ， 不 再 保 
证 是 用 户 程 序 放 入 的 参数 。 然 而 ， 先 前 入 栈 的 Re-R3 却 依然 保持 不 变 〈 除 非 高 优先 级 服务 例 程 暗 
中 使 坏 ， 算 改 了 堆栈 的 内 容 》 

















编程 扩 15 : 善 用 LDR/STR 中 的 多 种 寻 址 方式 


对 比 SetupIrqhandler 和 SetupExcpHandler 的 人 代码， 我 们 可 以 看 到 ， 在 
SetupIrqHander 中 ， 目 标 地 址 是 用 3 条 计算 出 来 的 ， 然 后 才 使 用 存储 指令 。 

而 SetupExcpHandler 就 聪明 多 了 ， 它 通过 对 仿 移 寄存 器 做 移 位 预 处 理 ， 把 计算 地 
址 巧妙 地 合并 在 存储 指令 的 内 部 ， 使 得 本 来 3 条 指令 做 的 事 1 条 指令 束 捐 定 了 。 

















这 个 小 小 的 例子 还 给 了 我 们 另外 的 局 示 : 学 习 时 要 求 其 解 ， 熟 能 生 巧 。CM3 中 有 很 
多 新 指令 , 它们 单独 使 用 或 者 组 合 使 用 , 能 让 温柔 小 女生 的 力气 大 增 , 晓 变 成 爱情 女神。 
比如 ，CLZ 与 RBIT 的 组 合 使 用 ， 残 快速 地 求 得 了 已 刻 中 表达 优先 级 的 位 数 。 此 外 ， 它 们 
还 对 “优先 级 位 图 调度 算法 ”有 决定 性 的 化 简 总 义 (both 时 间 上 的 和 空间 上 的 )， 有 闪 
趣 的 读者 可 以 拿 它们 去 化 简 uC/0S-II 中 的 调度 函数 , 看 看 能 不 能 去 挥 那 个 256 子 市 的 但 
找 表 。 




















11.7 在 C 中 使 用 SVC 


如 前 所 述 ， 因 为 晚 到 中 断 的 关系 ，SVC 中 不 能 再 使 用 寄存 器 来 传递 参数 ， 而 是 必须 使 用 堆栈 。 
因此 ， 和 需要 使 用 一 段 汇编 代 但 来 给 SVC 函 数 传 参数 。 如 果 SVC 服 务 例 程 的 主 部 由 C 来 号， 则 必须 在 前 
面 伴随 一 个 汇编 写 的 封皮 ， 用 于 把 堆栈 中 的 参数 提取 到 军 存 器 中 。 下 和 而 给 出 一 段 代 公 来 演示 这 个 工 
作 。 这 些 代 码 是 要 使 用 ARM 娘 家 的 编译 (armcc) 和 汇编 (armasm) 工具 来 处 理 的 ，RVDS 和 Keil RVMDK 
都 使 用 这 个 工具 链 。 

// 沪 编 封皮 ， 用 于 提出 堆栈 帧 的 起 始 位 置 ， 并 放 到 R86 中 ， 然 后 跳 转 至 实际 的 SVC 服 务 例 程 中 


asm void svc handler_ wrapper (void) 




















We 


IMPORT svc handler 
TST LR, #4 

工 工 世 EQ 

MRSEOQO RO, MSP 
MRSNE RO PSP 


B svc handler 


// ”不 必 写 下 BX LR 来 返回 ， 而 是 由 svc_hangdler 来 做 决定 
接 下 来 的 SVC 服 务 例 程 的 主体 就 可 以 由 Cc 来 写 了 ， 它 使 用 Re 作为 输入 参数 (这 也 是 堆栈 帧 的 起 始 
位 置 )， 用 于 进一步 提取 服务 代号 ， 并 且 传 递 参数 〈 通 过 堆栈 中 的 R8-R3 )。 
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蕉 喜 呀 ! 终于 看 到 此 一 段 C 代 人 码 了 【而且 还 是 一 段 很 为 类 的 C 程 序 哦 )! 


// 使 用 c 写 成 的 SVC 服 务 例 程 ， 接 受 一 个 指针 参数 (pwdSF ) : 扒 栈 栈 的 起 始 地 址 。 


// pwdSF [0] = RO , pwdSF[1] = R1 
// pwdSF[2] = R2 , pwdSF[3] = R3 
// pwqSE [4] = R12, pwdSF[5] = LR 
// pwdsSF[6] = 返回 地 址 〈 入 栈 的 PC ) 
// PwdSF [7] = XPSR 


unsigned long svc handler (unsigned int* pwdSF) 
{ 

unsigned int svc_number,; 

WnslLoned. int Sve E03 

unsigned int svc_rl; 

unsigned int svc_r2; 


UnsLgiied 1nt ‘sve .3 


V3 // 用 于 存储 返回 值 


svc_number = ((char *) pwdSF[6])[-2]; // 没 想 到 吧 ，c 的 数组 能 用 得 这 么 绝 ! 
SVvC_r0 = ((unsigned long) pwdSF [0]); 

Svc_rl = ((unsigned long) PwaSE [1]);} 

SVC_r2 = ((unsigned long) pwdSF [2] ) ; 

SvC_r3 = ((unsigned long) pwdSF [3] ) ; 

printf (“SVC number = %xn’”, svce_ number); 

printf (“SVC parameter 0 = %x\n”, svc_r0); 

printf (“SVC parameter 1 = %x\n”, svc_r1); 

printf (“SVC parameter 2 = %$x\n”, Svc_r2); 

printf (“SVC parameter 3 = %$x\n”, svc_r3); 


// 做 一 些 工 作 ， 并 且 把 返回 值 存储 到 retval 中 
pwdSF [0]=retVal; 


return 0; 





注意 ， 这 个 函数 返回 的 其 实 不 是 0! 进一步 地 ， 灰 色 的 文学 只 是 用 于 哄 编 译 占 开心 的 一 一 让 它 
认为 这 个 函数 是 个 有 返回 值 的 函数 ， 而 且 确 实 返 回 一 个 数值 了 ， 于 是 不 再 吵 曾 看 说 有 错 或 启 告 什么 
的 。 那 返回 的 是 喻 ?当然 是 retVal 啦 ! 有 点 迷糊 么 ? 那 还 不 快 往 下 看 ! 

原来 ，SVC 服 务 例 程 不 能 像 普 通 的 C 函 数 那样 一 一 通过 把 原型 声明 为 ”unsigned int func()%, 再 在 末 
尾 来 一 名 "return xx;” 来 返回 。 因 为 这 种 常规 的 作法 在 所 有 的 ARM 中 其 实 是 把 返回 值 放 到 RO 里 。 但 是 
串 瑟 了 ， 这 个 图 数 可 是 弄 第 服务 例 程 ， 它 的 返回 可 是 孚 受 “ 异 间 返 回 ” 的 待遇 的 一 一 伴随 看 一 个 便 
件 控制 的 目 动 出 栈 行为 ， 这 会 从 堆栈 中 重建 RO 的 值 ， 从 而 窗 关 “return” 指 定 的 值 。 因 此 ， 它 必须 
把 返回 值 写 到 堆栈 中 RO 的 位 置 ， 才 能 借 目 动 出 栈 之 机 返回 自己 的 值 (pwdSF[0]=retVal) 。 

这 下 可 真相 大 日 了 ! 虽然 内 部 暗流 漠 涌 ， 但 是 从 应 用 程序 的 表面 上 看 还 是 风平浪静 一 一 对 于 系 
统 服务 函数 来 说 ， 这 种 独特 的 返回 方式 与 普通 的 return xx 效 果 是 相同 的 ， 依 然 可 以 用 普通 的 形式 接 
收 返 回 值 。 怎 么 样 ， 这 招 够 狠 吧 ! 其 实 ， 在 写 系 统 软件 时 ， 这 根本 算 不 上 要 狠 ， 只 不 过 是 寻 香 的 基 
本 功 及 了， 要 不 然 怎么 说 C 是 “低级 高 级 语言 > 呢 。 而 病毒 /木马 所 采用 的 “堆栈 / 绥 冲 区 溢出 攻击 ”， 
那 才 算 真 正 的 狠 招 呢 , 但 是 它们 原理 是 一 脉 相 承 的 。 可 见 , 对 压 层 理解 得 深刻 , 能 让 我 们 写 出 更 好 ， 
更 强大 的 程序 来 。 
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在 RVDS 和 Keil RVMDK 中 ， 为 了 方便 我 们 放 参 数 ， 提 供 了 “_svc” 编 译 器 指示 字 。 举 例 来 说 ， 如 
果 需 要 在 3 号 服务 请 求 中 传递 4 个 参数 ， 则 可 以 类 似 下 例 写 : 


unsigned long .__svcec(0x03) CallSvc3 (unsigned long svc_ r0, unsigned long 





svc_rl, unsigned long svc_r2, unsigned long svc_r3);， 
当 C 程 序 调 用 这 种 疯 数 时 ， 则 编 详 占 会 目 动 生成 SVC 指 令 ， 如 下 所 示 : 
int Func (void) 
{ 
unsigned long p0，pl，p2，p3; // 传 递 给 svc 服 务 例 程 的 4 个 函数 
unsigned long svcRet; / /系统 服务 的 返回 值 


svcRet=CallSvc3 (p0, pl, p2, p3); // 呼叫 3 号 系统 服务 , 并 且 传 递 4 个 参数 , 依次 为 : pl1,p2,p3,p4， 
青 接收 返回 值 到 svcRet 中 〔( 别 息 了 ， 这 个 返回 值 的 来 历 不 寻常 ) 


return; 


如 欲 获 知 _svc 的 官方 说 明 ， 可 以 查阅 《RVCT 3.0 Compiler and Library Guide(Ref6)》。 

如 来 使 用 的 是 GNU 的 工具 链 , 里 面 没 有 _ svc 关 键 学 。 但 是 GCC 文 持 内 联 汇编 , 可 以 实现 此 功能 。 
例如 ， 如 宋 需 要 呼叫 3 号 系统 服务 ， 同 时 传递 一 个 参数 ， 还 接收 一 个 返回 值 〈 两 者 都 通过 RO) ， 则 
可 以 使 用 如 下 的 内 联 汇编 来 呼叫 SVC: 
int MyDataIn = 0X123; 
asm volatile ("mov RO, $0\n’” 

人 MY 

上 段 内 联 汇编 码 中 ， 两 个 “: ”后 面 分 别 对 应 输入 数据 一 一 由 r(MyDataln) 指 定 ， 以 及 输出 数据 
一 一 即 上 段 代 码 中 是 "”， 语 法 模式 如 下 所 未 : 
asm ( assembler code : output_ list : input list ) 

在 第 19 草 中 ， 给 出 了 使 用 GNU 工 具 链 的 更 多 汇编 例子 。 如 欲 获取 有 关内 联 汇编 的 详细 信息 ， 还 
请 参阅 GNU 工 具 链 的 说 明文 档 。 
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第 12 音 


编程 进 了 i 己 系 统 行为 


在 系统 中 使 用 双 堆栈 
双 字 的 堆栈 对 齐 方式 
非 基 级 的 线程 模式 
性 能 评估 

当 处 理 器 被 锁定 时 


阅读 理解 本 章 ， 需 要 有 操作 系统 的 基本 概念 : 定义 、 作 用 及 地 位 


12.1 在 系统 中 使 用 汉 堆 枝 


CM3 的 出 现 ， 让 单片机 业界 也 能 出 双 检 李向阳 。v7-M 架构 的 一 个 重要 能 力 ， 就 是 提供 了 这 个 双 
堆栈 的 设计 ， 人 允许 把 用 户 应 用 程序 的 堆栈 与 特权 级 /操作 系统 内 核 (kernel ) 的 堆栈 分 开 。 如 果 再 辅 
以 MPU， 还 能 进一步 地 阻止 用 户 程 序 访问 内 核 的 堆栈 ， 同 时 也 消除 了 内 核 数据 个 破 坏 的 可 能 。 

要 在 CM3 中 创建 可 车 打 打 的 系统 , 必须 两 手 抓 , 两 手 都 要 便 。 典 型 情况 下 , 一 个 真正 健壮 的 CM3 
软件 系统 是 要 使 用 实时 操作 系统 内 核 的 ， 通 第 会 符合 如 下 的 要 求 : 

@ 服务 例 程 使 用 MSP 在 “ 非 基 级 线程 模式 ”中 会 讲 到 例外 情况 ) 

@ 人 尺 管 寞 常服 务 例 程 使 用 MSP， 但 是 它们 在 形式 上 返回 后 ， 内 容 上 却 可 以 依然 继续 一 一 而 且 

此 时 还 能 使 用 PSP， 从 而 实现 “可 抢占 的 系统 调用 ” 大 帆 提 高 实时 性 能 

@ 通过 SysTick， 实 时 内 核 的 代码 每 隔 固定 时 间 都 被 调用 一 次 ， 运 行 在 特权 级 水 平 上 ， 人 负责 

任务 的 调度 、 任 务 时 间 管 理 以 及 其 它 系统 例 行 维护 

@ 用户 应 用 程序 以 线程 的 形式 运行 ， 使 用 PsP， 并 且 在 用 户 级 下 运行 

@ 内 核 在 执行 关键 部 位 的 代码 时 ， 使 用 MSP， 并 且 在 辅 以 MPU 时 ，MSP 对 应 的 堆栈 只 允许 特 

权 级 访问 

如 图 12.1 所 示 ， 假 设 系统 内 存 是 一 块 SRAM， 则 我 们 可 以 通过 MPU， 把 它 分 为 两 个 regions， 
其 中 一 个 用 于 用 户 级 ， 男 一 个 用 于 特权 级 。 男 外 别 态 了 CM3 的 堆栈 是 “ 回 下 生长 的 满 栈 ”” 因此 需 
要 把 这 两 个 SP 初始 为 指 癌 这 两 个 regions 的 项 亲 。 
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主 堆 材 初 始 值 


只 有 特权 极 
才能 访问 
存储 器 
地 址 ”| SRAM 进程 堆栈 初始 值 


用 户 级 可 访问 





12.1 用 户 级 /特权 级 下 的 内 存 配置 示 学 


上 电 后 ， 通 过 从 癌 量 表 中 取出 8 写 癌 量 ， 仪 初始 化 了 MSsP。 因 此 ， 需 要 拨 外 的 工作 来 建立 完整 
的 双 扒 栈 系统 。 对 于 使 用 汇编 号 成 的 代码 ， 上 只 需 帮 窒 几 癸 : 














; 这 段 代码 在 用 户 可 访问 内 存 中 ， 但 从 特权 级 开始 执行 


BL MpuSetup ; 建立 MPU regions, 并 使 能 存储 右 保 护 

LDR RO, =PSP_TOP ; 读 取 进 程 堆 栈 的 栈 顶 

MSR PSP， RO ; 并 用 它 来 初始 化 进程 堆栈 

BL SystickSetup ; 配置 SysTick， 并 建立 SysTick 异 常 回 量 ， 供 os 日 后 使 用 
MOV RO, #0x3 ; 设置 CONTROL 寄 存 器 ， 让 用 户 程序 使 用 PSP 

MSR CONTROL, RO ; 并 且 切 入 用 户 级 

B UserAppStart ; 到 了 这 里 已 经 进入 了 用 户 级 ， 开 始 跳 入 用 户 程 序 入 口 


这 个 函数 最 好 用 汇编 写 。 如 下 非 要 用 C， 则 会 破坏 C 函数 的 堆栈 帧 : 因为 C 函数 党 第 把 多 出 来 
的 局 部 变量 放 到 堆栈 中 ， 所 以 在 切换 堆栈 指针 时 ， 函 数 的 局 部 变量 可 能 丢失 。 在 Cortex-M3 TRM 
CRef1) 中 ， 已 经 做 出 明确 建议 : 使 用 形 如 svc 的 ISR 来 调用 内 核 ， 然 后 通过 修改 EXC_RETURN 
的 值 来 切换 堆栈 指针 。 



















EXC_RETURN=0OxFFFFFFF9 建立 PSP， 并 创建 | 把 EXC_RETURN | ”把 用 户 堆栈 帧 
任务 的 堆栈 帧 改 为 OxFFFFFFFD 弹 入 守 存 恕 中 
特权 级 (PC, xPSR) 后 返回 
Handler 模 式 









特权 级 - 

线程 模式 mt he 操作 系统 代码 

用 户 级 | 用 户 程序 | 
线程 模式 





12.2 简单 OS 中 的 堆栈 初始 化 
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在 操作 系统 中 , 对 于 EXC_RETURN 的 修改 , 只 是 再 寻常 不 过 基本 需求 。 在 开始 调度 用 户 程序 后 ， 
一 定 还 伴随 着 SysTick 异常 , 它 周 期 性 把 执行 权 转 入 操作 系统 ， 从 而 使 例 行 的 系统 管理 以 及 必要 轮 
转调 度 得 以 维持 一 一 差不多 就 是 系统 的 心跳 吧 ， 如 图 12.3 所 示 : 
























通过 PsP 保存 用 户 
程序 #1 的 堆栈 帧 
再 把 PsP 指向 用 户 


OS 县 起 PendSV 
以 便 返 回 后 执行 
调度 /上 下 文 切换 


EXC RETURN=0xFFFFFFFD 












Os 执行 系统 管理 异常 返回 


持 权 级 程序 #2 的 堆栈 帧 

nan er 的 | | ee 
竺 权 级 内 容 压 入 堆栈 堆栈 帧 弹 入 寄存 器 
les 帧 #1 

线程 模式 SysTick PendSV 

用 户 级 

线程 模式 响应 SysTick 异 常 





12.3 SysTick 异 单 推动 简单 轮转 调度 模式 图 


在 这 里 ， 使 用 PendsV 一 个 优先 级 最 低 的 异常 ) 来 执行 上 下 文 切 换 ， 从 而 消灭 了 在 中 断 服 务 
例 程 中 出 现 上 下 文 切 换 的 可 能 ， 读 者 应 该 对 此 还 记忆 犹 新 吧 。 
然而 ， 也 有 不 少 的 程序 不 需要 上 操作 系统 。 即 便 如 此 ， 使 用 两 个 栈 也 依然 对 于 提升 程序 的 可 苇 
性 大 有 用 场 。 其 中 一 个 可 行 的 方案 是 , 以 MSP 局 动 CM3 时 把 MSP 初始 化 成 某 进 程 的 堆栈 Cprocess 
stack)。 这 样 ， 束 可 以 使 初始 化 代码 使 用 进程 堆栈 中 运行 (虽然 还 使 用 MsP)。 在 正式 执行 应 用 程 
序 前 ， 移 执行 如 下 的 初始 化 代码 : 
; 从 特权 级 启动 ，MSP 指 向 一 个 用 户 程序 的 堆栈 





























MpuSetup () ; // 建 YMPU regions 并 使 能 存储 器 保护 
SystickSetup () ; // 建立 SysTick 腊 种 问 量 ， 由 其 服务 例 程 作 为 时 基 的 管理 


SwitchstackPointer(); // 呼叫 一 个 汇编 程序 来 切换 到 PSP 


A 在 SwitchstackPointer 中 ------- 

PUSH {RO, R1, LR} 

MRS RO, MSP ; 读 取 MSP 到 RO0， 稍 后 使 用 

LDR Ri, =MSP_TOP 

MSR MSP, R1 ; 让 MSP 指 问 狐 的 MSP_TOP 

MSR PSP, RO ; 把 当前 的 MSP 和 存储 到 PSP 中 

MOV RO, #0x3 

MSR CONTROL,RO ; 切换 到 用 户 级 ， 并 使 用 PsP 指 向 的 堆栈 作为 当前 堆栈 
POP {RO, R1, PC} 

ee 加 Eee 4 





; 现在 已 经 进入 了 用 户 级 ， 使 用 PSP， 并 且 没 有 和 弄 丢 局 部 变量 
UserApplicationStart (); // 在 用 户 级 下 开始 执 应 用 程序 


12.2 汉字 的 堆栈 对 齐 方式 


在 符合 AAPCS 的 应 用 程序 中 , 对 于 啊 应 异常 时 的 堆栈 操作 , 是 有 必要 对 齐 到 原始 (primitive) 
的 数据 尺寸 的 (1,2,4 或 8 字 市 )。 这 是 CM3 的 一 个 可 配置 选项 。 欲 使 能 此 特性 ， 需 要 把 NVIC 配置 
控制 寄存 器 的 STKALIGN 置 位 〈 在 附录 D 的 表 D.17 给 出 定义 )， 如 下 面 汇 编 代 码 所 演示 : 
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LDR RO, =0xE000ED14 ; RO0=NVIC CCR 的 基 址 
LDR R1, [RO] 

ORR.W Ri1, R1, #0x200 ; 设 兽 STKALIGN 人 YY 
STR R1, [RO]J ; 更 新 NVIC_ CCR 





如 果 使 用 C 语言 ， 则 代码 如 下 : 
#define NVIC_CCR ((volatile unsigned long *) (0XEOOOED14) ) 
*NVIC_CCR= *NVIC_CCR | 0x200; /* 设置 STKALIGN 位 */ 

如 果 在 入 栈 时 STKALIGN 位 为 1， 则 xPSR 的 位 9 功能 启用 ， 指 示 在 入 栈 时 sP 的 值 是 否 为 了 对 
齐 而 作出 了 调整 。 在 出 栈 时 ， 会 检查 入 栈 的 xPSR.9， 再 根据 它 的 值 把 SP 的 值 调 整 回去 。 

注意 : 切 乡 在 民利 服务 例 程 中 改动 STKALIGN 位 的 值 ， 耕 则 会 使 出 栈 时 数据 发 生 错 位 ， 彻 搬 破 
坏 各 个 寄存 器 的 什 ， 这 第 和 是 致命 错 误 〈 跑 飞 ， 和 死机 等 )。 

要 注意 的 是 ,这 个 特性 是 在 CM3 修订 版 1 开始 后 才 引 入 的 ,早期 基于 版 本 8 的 产品 则 无 此 功能 。 
当 需 要 符合 AAPCS 时 ， 需 要 局 用 此 特性 。 此 外 ， 妆 程序 的 一 部 分 是 使 用 C 开 友 ， 且 程序 中 包含 了 对 
双子 数据 的 处 理 时 ， 也 推荐 局 用 此 功能 。 

在 最 新 的 修订 所 2 中 ， 该 特性 不 需 手 动 使 能 ， 而 是 在 缺 省 时 已 使 能 。 在 使 用 C 开发 时 ， 如 果 程 
序 包 含 了 需要 双 字 尺寸 的 数据 类 型 (double，long long / INT64) 时 ， 推 荐 使 能 此 特性 。 























12.3 非 基 级 的 线程 模式 


在 CM3 中 ， 原 则 上 异常 服务 程序 要 在 handler 模式 下 执行 ， 但 是 也 允许 在 服务 例 程 中 切换 到 
线程 模式 。 通 过 设置 NVIC 配置 与 控制 寄存 器 的 “ 非 基 级 线程 模式 允许 ”位 CNONBASETHRDENA， 位 
偏 移 : 6)， 可 以 在 服务 例 程 中 把 处 理 器 切换 入 线程 模式 。 为 什么 要 这 么 做 ? 如 果 中 断 服务 例 程 是 用 
户 程 序 的 一 部 分 ， 可 能 需要 让 它 在 线程 模式 下 执行 ， 以 限制 它 访问 特权 级 下 的 资源 ， 此 时 可 以 让 此 
功能 派 上 用 场 〈 对 于 让 cM3 在 线程 模式 下 赋予 用 户 级 访问 权限 的 配置 ， 不 在 本 节 中 完成 ， 而 是 在 上 电 初 始 化 时 就 
一 次 性 地 做 好 了 一 一 译 者 注 )。 























小 心地 使 用 此 功能 


如 果 使 用 此 功能 ， 则 圳 要 手工 调整 堆栈 指针 ， 还 要 重建 堆栈 中 的 数据 。 这 种 东 坤 大 
挪移 可 十 高 度 危 险 的 作业 ， 一 个 小 必 惑 很 容易 把 整个 系统 卉 葵 。 所 以 必须 格外 严肃 地 对 





符 。 画 外 ， 在 使 用 时 ， 系 统 设计 者 还 必须 保证 服务 例 程 能 正确 地 返回 。 因 为 在 线程 模式 
下 是 不 允许 作 中 断 返 回 的 , 所 以 必须 用 一 氮 手 脆 才 行 。 如 条 放任 不 管 , 则 中 断 无 法 退出 ， 
这 会 永远 阻塞 其 它 同 级 和 更 低 优先 级 中 断 。 通 向， 由 系统 软件 负责 完成 这 种 工作 。 

















在 局 用 本 功能 时 ， 必 须 伴 随 看 一 个 “服务 例 程 重 定 向 ”动作 :中断 问 量 指 向 一 个 运行 在 特权 弘 
的 服务 例 程 ， 但 它 却 是 应 该 只 访问 用 户 级 内 存 的 ， 因 此 必须 完 在 头 部 切入 用 户 级 ， 调 用 真正 干 活 的 
服务 例 程 ， 青 在 最 后 回 到 特权 级 。 演 示 代 人 码 如 下 所 示 : 


redirect handler 














PUSH {LR} 

SVC #0 ; 呼叫 系统 服务 ， 用 于 把 特权 级 别 改 为 用 户 级 
BL User | RQ Handl er 

SVC al ; 执行 完 中 断 处 理 后 ， 回 到 特权 级 

POP {PC} ; 启动 本 次 中 断 的 返回 序列 
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上 例 中 , 字体 不 同 的 中 间 两 行 是 在 线程 模式 HPSP 下 执行 的 。 在 这 段 代 码 中 ,通过 首尾 的 两 个 系 
统 调 用 来 完成 丈 坤 大 挪移 : 

使 用 SVC #8@， 它 先 使 能 非 基 级 线程 模式 ， 再 找 贝 主 堆 栈 中 被 压 入 的 8 个 寄存 右 到 进程 堆栈 并 
更 新 PSP 的 值 ， 最 后 修改 EXC_RETURN， 以 使 返回 后 进入 “线程 模式 .用户 级 +PSP 堆栈 ” 

使 用 SVC #1 来 使 一 切 归 位 ， 它 除 能 非 基 级 模式 ， 恢 复 PSP 先前 的 位 置 ， 并 且 修 改 EXC_RETURN 
以 返回 到 特权 级 ， 继 续 使 用 主 堆 栈 。 

在 最 后 执行 到 返回 指令 后 ， 则 终结 了 本 次 异常 处 理 序 列 。 虽 然 redirect_handler 的 内 部 有 这 
么 多 的 暗箱 操作 ， 但 是 在 表面 上 看 还 是 很 傻 很 天 真 的 ， 也 束 5 行 “ 安 分 守 己 ”的 指令 而 已 。 

听 起 来 很 神 吧 ， 那 就 让 我 们 把 这 个 内 幕 上 曝光 。 这 可 是 一 道 大 荤菜 ， 可 以 尝 尝 系统 程序 大 肉 的 味 
道 。 这 个 菜 是 很 “ 油 ” 的 ， 最 好 边 吃 边 看 图 12.4 来 帮助 消化 。 使 用 上 一 章 讲 到 的 SVC 服务 例 程 框 
架 ， 在 这 里 搭 成 了 真正 能 干 活 的 系统 服务 : 
svc _ handler 


; 小 测试 : 请 谈 者 为 本 段 代码 加 注释 
































有 LR #0x4 ; 测试 EXC_RETURN .2 
ITE EQ ; 如 果 为 去 则 
MRSEO RO, MSP ; 先前 使 用 的 是 主 堆栈 ， 把 MSP 的 值 加 载 到 R0 








MRSNE RO, PSP ; 否则 ， 先 前 使 用 的 是 进程 堆栈 ， 把 PsP 的 值 加 载 到 R0 
DN 本 [RO, #24] ; 读 取 入 栈 的 返回 值 

LDRB RO, [R1, #-2] ; 提出 8 位 立即 数 调 用 代号 

CBZ ro, SVC_ service 0 

CMP 0 #1 

BEO SvC service 1 

B.W Unknown_SVC_ Request 


0 号 服务 : 切换 到 “线程 模式 +PSP” 


SVvC service 0 


we 








MRS RO PSP ; 读 取 PSP 

SUB RO, RO, #0x20 ”; 开 出 32 字 节 的 空间 存储 8 个 寄存 器 

MSR Se RO ; 更 新 PSP 的 值 

MOV Ry #8*4 ; R1 作 为 拷贝 堆栈 帆 (8 个 寄存 器 〉 的 循环 变量 
SVC_Sservice_ 0_ copy_loop 

SUBS R1, R1, #1*4 

LDR R2 ， [SP, R1] 

STR R2, [RO, R1] 

CMP R1, #0 

BNE SVC_SsService 0_copy_loop 

STRB R1, [RO, #0x1C] ; 在 进程 堆栈 中 清 零 IP SR 

LDR RO, =0xE000ED14 ; 加 载 NVIC 中 CCR 〈 配 置 与 控制 寄存 器 ) 的 地 址 

LDR 总 | [r0] 

ORR el #1 

STR r1， [r0] ; 使 能 非 基 级 线程 模式 〈 这 里 的 地 址 不 在 位 带 操作 区 ) 

ORR LR, #0xC ; 修改 EXC_RETURN， 以 使 得 返回 后 进入 线程 模式 +PSP 

BX LR ; 局 动 异 常 返 回 序列 ， 执 行动 作 


1 号 服务 ;从 线程 模式 +PSP 人 返回 到 handler 模 式 


SvCc service 1 


we 





MRS RO, PSP ; 谈 取 PSP 到 RO0， 以 便于 后 续 的 一 系列 归 位 处 理 
LDR R1, [RO, #0x18] ; 读 取 压 入 PSP 中 的 返回 地 址 ( 即 svce #1 后 面 的 
; POP {PC}) 
STR R1, [SP, #0x18] ; 因为 将 要 返回 到 handler 模 式 ， 所 以 把 它 转移 到 MSP 
ADD 交 训 ， RO, #0x20 ”; 把 PsP 的 值 归 位 一 一 刚 响应 外 部 中 断 时 的 值 
MSR RISE RO ; 用 归 位 后 的 全 更 新 PSP 
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LDR RO, =0xE000ED14 ; NVIC 中 配置 与 控制 寄存 器 〈CCR) 的 地 址 

LDR Es [r0] ; 再 次 读 取 NVIC 中 的 cCR 

BIC Ee #1 

SR rl1, [r0] ; 清除 NONBASETHRDENA 位 ， 

BIC 1 风情 #0xC ; 修改 EXC_RETURN 以 返回 nandler 模 式 ，MSP 亦 归 位 
BX LR 








使 用 SVC 是 必须 的 ， 因 为 只 有 通过 和 卉 第 返回 才能 改动 IPSR 的 值 。 软 件 触 发 中 断 也 能 用 ， 但 那 
种 偶 方 是 劳 门 那 道 ， 因 为 它 是 不 精确 的 ， 而 且 可 衣 被 阻塞 《回顾 前 一 章 )， 带 来 了 隐患 一 使 得 
栈 找 贝 与 切换 操作 不 被 立即 执行 

图 12.4 给 出 了 上 述 代码 的 工作 序列 图 ， 如 果 吃 人 不消 的 话 束 赶快 看 吧 : 


存储 器 中 断 Ee SVC 1 SVC 1 返回 中 断 返 回 
地 址 SVC0 返 回 | 













MSP 


堆栈 帧 拷贝 到 


PSP 进程 堆栈 







n 
} 
| 


Pa | 

/ | / \ 

7 | /二 一 
| » 

| | | 1 手工 调整 

CL) | | psp 

\_/ | / 





处 理 器 模式 ey 一 inde 红 要 一 
"rrr 


优先 级 
SVC 


中 断 
特权 级 下 的 | 
线程 模式 


用 户 线程 


| 


图 12.4 非 基 级 线程 模式 操作 模式 图 
手工 调整 PSP 也 是 必须 的 。 如 条 没有 第 一 次 调整 ， 则 和 在 信 SVC0 返 回 的 形 却 进 入 用 户 IRQ 服 务 例 程 





后 ， 会 使 PSP 回 到 进入 中 断 前 的 状态 。 然后 在 执行 csvc 4 时， 将 重新 把 寄存 器 压 入 栈 一 一 但 此 时 的 
寄存 右 已 经 是 被 用 户 IRQ 服 务 例 程 用 过 的 了 ! 结果 ， 虽 然 PSP 的 值 与 两 次 调整 后 的 还 相同 ， 但 是 PSP 
中 寄存 器 内 容 已 经 被 破坏 了 ! 

对 MSP 的 调整 也 是 很 有 锚 力 的 ， 它 突破 了 崩 套 的 异常 在 返回 时 ， 一 定 要 从 MSsP 出 栈 的 教条 。 这 
段 代 码 中 对 MSP 和 PSP 的 把 玩 ， 是 不 是 很 精湛 ? 在 真实 的 操作 系统 中 ， 还 有 更 刺激 的 动作 。 
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12.4 性 能 评估 


为 了 让 CM3 能 尽情 地 释放 她 的 青春 能 量 ， 还 需要 我 们 清扫 路 上 其 它 石子 。 
第 一 ， 要 消炎 存储 器 等 待 周 期 。 在 MCU/SoC 的 设计 期 间 ， 就 应 该 优化 存储 器 系统 ， 最 起 码 的 要 求 ， 
也 要 允许 取 指 和 数据 访问 能 并 行 不 悖 ， 这 才 对 得 起 “哈佛 结构 ”的 称号 。 此 外 ， 应 尽 可 地 使 用 32 位 
的 存储 絮 。 对 于 软件 开发 人 员 ， 还 应 该 划 清 代码 与 数据 的 界线 ， 使 得 程序 代码 从 代码 区 执行 (使 用 
|-Code 总 线 ) ， 而 绝 大 部 分 数据 都 从 数据 区 访问 (使 用 System 总 线 ， 而 不 要 使 用 D-Code 总 线 ) ， 哪 
怕 是 多 浪 费 点 内 存 。 只 有 这 样 ， 才 能 使 取 指 与 访问 数据 同时 进行 。 
第 二 ， 如 果 没 有 必要 ， 中 断 问 量 表 也 放 到 代码 区 中 。 只 有 这 样 ， 才 能 使 取 问 量 (I-Code 总 线 ) 与 入 栈 
(System 总 线 ) 同 时 进行 。 如 果 辣 量 表 在 RAM 中 ， 束 会 出 现 取 回 量 与 入 栈 抢 总 线 的 情况 ， 必 然 导 致 额 
外 的 中 断 延 迟 被 引入 《当然 在 极 个 别 情况 下 ， 如 果 把 SRAM 放 到 Code 区 ， 则 使 用 D-Code 总 线 入 栈 。 
但 如 果 束 为 了 放 癌 量 表 而 专 配 一 个 SRAM， 代 价 未 免 也 太 大 了 ) 。 
第 三 、 限 制 使 用 非 对 齐 访问 。 前 面 讲 到 ，CM3 总 线 内 部 其 实 只 接受 对 齐 访 问 ， 而 由 总 线 接口 来 堵 完 
条: 把 一 个 非 对 齐 的 访问 拆 成 大 干 个 对 齐 的 访问 ， 来 实现 这 种 透明 性 。 可 见 ， 一 次 非 对 齐 访问 可 能 
要 数 次 对 齐 访问 才能 完成 〈 最 坏 情况 下 3 次 ) 。 而 且 节 省 内 存 的 正道 ， 在 于 优良 的 程序 结构 和 算法 
设计 ， 从 来 不 在 这 种 见缝插针 地 乱 挤 上 。 除 非 是 客观 上 被 定 死 的 (常见 于 某 些 早期 网 络 协议 的 报 文 
头 部 ) ， 否 则 应 在 心里 暗 下 决心 决 不 染指 非 对 齐 访问 ， 在 设计 数据 结构 及 定义 变量 时 ， 都 高 度 自 
觉 。 在 ARM 汇 编 器 中 ， 提 供 了 ALIGN 指 示 字 (GNU As 中 也 有 类 似 的 汇率 器 指示 字 ) ， 可 以 保证 产生 
所 需 的 对 齐 方式 。 
虽然 我 们 会 在 绝 大 多 数 场合 下 使 用 Cc 来 开发 ， 但 是 在 为 某 个 关键 的 功能 启动 “汇编 级 待遇 ”时 ， 
不 要 筷 了 使 用 下 述 的 技巧 ， 它 们 经 和 常 能 产生 意 想 不 到 的 特效 : 
1 . 使 用 帝 偏 移 量 寻 址 的 LDR/STR 指 令 , 进一步 地 ,还 可 以 对 偏 移 量 作 侈 位 预 处 理 (LSL 用 得 最 多 ) 。 
使 用 这 种 强大 的 寻 址 方式 , 常常 能 省 去 分 立 的 地 址 增 减 / 乘 除 计算 操作 。 重 温 一 下 上 一 间 中 使 能 
中 汤 和 使 能 异常 子 程 的 不 同 ， 相 信 会 有 切身 的 体会 
2 . 把 上 下 文 相 关 的 变量 放 到 一 起 一 一 也 束 是 说 使 它 的 地 址 是 连续 的 。 这 样 就 可 以 创造 使 用 
LDM/STM 指 令 的 机 会 。 只 要 人 直到 连续 地 址 的 数据 传送 , 束 使 用 LDM/STM 。 一 条 传送 14 个 字 的 LDM 
和 令 ， 可 远 比 14 个 LDR 要 快 多 了 ， 而 且 代 码 也 巨 幅 精简 
3 . 当 遇 到 很 小 的 “ifthen” 块 时 ， 如 果 使 用 条 件 跳 转 指 令 ， 则 会 使 流水 线 被 清洗 ， 花 不 少时 间 。 
这 时 ， 应 使 用 IF-THEN 指 令 〈ITxxx) 。IT 指 令 在 张开双 臂 时 ， 最 多 能 保护 4 个 孩子 。 
4 .如果 旧 时 需要 两 条 Thumb 指 令 才 能 完成 的 操作 ， 现 在 可 以 由 一 条 Thumb-2 指 令 完 成 ， 则 应 使 用 
Thumb-2 指 令 。 
5 . 为 使 目 己 成 长 为 大 虾 ， 要 学 会 使 用 CM3 的 新 好 指令 。 尤 其 是 在 ARMv6 后 才 新 出 来 的 ， 都 是 无 数 
前 人 经 验 的 结晶 ， 常 常 能 有 戏剧 般 地 优化 《回顾 RBIT 与 CLZ 的 梦幻 组 合 ) 

















































































































12.5 当 处 理 器 侯 锁 定 (Lockup) 时 


这 人 确实 是 很 扎 手 的 问题 ， 本 来 束 已 经 因为 出 错 而 进入 fault 服 务 例 程 了 ， 结 果 fault 服 务 例 程 也 触 
犯 了 fault 条 件 ， 升 级 为 便 fault 的 。 可 如 果 便 fault 服 务 例 程 也 脑子 进 水 了 怎么 办 ? 一 错 再 错 ， 最 终 使 
CM3 在 万 般 无 条 下 进入 锁定 状态 。 万 万 要 避免 它 ， 因 为 一 旦 锁定 驶 不 可 救 要 了 几乎 只 能 复位 ， 
这 在 使 命 -关键 〈mission-critical) 系统 中 是 雇 不 允许 的 《〈 像 那 种 大 型 交换 机 、 体 外 循环 机 等 设备 ) 。 
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12.5.1 锁定 情形 下 的 众生 相 


在 锁定 下 ， 寄 存 器 和 存储 器 都 被 “冻结 ”，PC 的 值 被 强制 为 0xFFFF_FFFx， 并 且 原 地 打转 地 定 死 
在 那里 一 直 取 指 。 与 此 同时 ，CM3 的 另 一 条 名 叫 “LOCKUP” 的 输出 信号 线 将 被 置 为 有 效 ， 芯 片 厂 商 
可 以 检测 此 信号 ， 并 且 在 系统 复位 发 生 器 上 触发 一 个 复位 。 

其 体 地 说 ， 下 列 场 合 会 导致 锁定 : 

@ 在 便 fault 服 务 例 程 中 产生 faults〈 双 重 fault ) 

@ 在 NMI 服 务 例 程 中 产生 faults 

@ 在 复位 序列 (初始 的 MSP 与 PC 读 取 )〉 中 产生 总 线 fault 

在 双重 fault 下 ，NMI 还 能 啊 应 《再 次 证 明了 它 的 第 一 优先 地 位 ) 。 然 而 在 NMI 服 务 例 程 退出 后 ， 
又 回 到 锁定 状态 。 此 时 ， 当 前 优先 级 为 -1， 因 此 可 以 啊 应 NMI 一 一 NMI 的 优先 级 是 -2， 比 当前 的 高 。 

在 产品 中 出 现 锁定 瓯 等 同 于 是 大 限 已 到 。 但 是 在 调试 阶段 也 许 还 能 让 系统 起 死 回 生 : 如 来 连接 
了 调试 器 ， 则 可 以 喊 停 (halt) 处 理 器 ， 然 后 手工 修改 PC 的 值 。 然 而 这 也 往往 是 无 力 的 : 因为 上 下 
文 没有 了 一 一 所 有 的 寄存 器 ， 以 及 中 断 系 统 ， 都 已 经 物 是 人 非 ， 需 要 重新 初始 化 ， 才 能 返回 到 正常 
的 操作 中 。 

那 为 什么 不 直接 复位 ， 好 让 它 早 点 在 下 个 轮回 中 转世 投胎 呢 ? 原 来， 系统 的 生命 是 开发 者 赋予 
的 ， 因 此 瓯 要 对 它 的 生死 负责 。 哪 怕 死 了 ， 也 要 明白 死因 才 行 。 如 果 当 场 承 复位 了 ， 则 所 有 寄存 需 
的 值 都 归 位 了 ， 不 再 有 机 会 去 但 明 当时 的 情况 。 

如 果 不 是 使 命 -关键 系统 ， 则 可 以 使 用 一 个 看 门 狗 ， 它 可 以 使 系统 从 锁定 状态 中 复位 。 

还 要 注意 的 是 ， 如 果 在 啊 应 NMI 或 便 fault 的 入 栈 /出 栈 阶段 触发 了 总 线 fault， 则 不 会 导致 锁定 ， 
只 是 会 其 起 总 线 fault， 如 图 12.5 所 示 。 


优先 级 此 时 的 fault 不 会 -一 & ~ 此 时 的 fault 不 会 
导致 处 理 器 锁定 导致 处 理 器 锁定 
























































el | < 


255to0 l p= 


ea 硬 fault/NMI 服务 例 程 


图 12.5 “只 有 在 硬 fault/NMI 服务 例 程 中 的 fault 才 锁定 系统 


12.5.2 避免 久 锁 定 


既然 被 锁定 台 等 同 于 和 死机， 我 们 唯一 能 做 的 也 只 能 是 避免 锁定 状态 。 因 为 锁定 上 只 出 现 于 NMI 和 
便 fault 的 服务 例 程 中 ， 所 以 当 我 们 在 设计 它们 时 ， 一 定 要 分 外 地 小 心 ， 束 好 像 亲 手 给 目 己 的 爱人 做 
大 手术 那样 地 一 丝 不 苘 。 比 如 ， 我 们 应 该 尽量 避免 不 必要 的 扒 栈 访问 ， 这 是 有 原因 的 。 对 于 NMI 来 
说 ， 因 为 在 进入 NMI 时 党 第 是 在 危 写 关头 ， 如 : 挥 电 ， 短 路 等 价 件 故障 。 此 时 ， 有 可 能 存储 系统 已 
经 失 能 了 。 而 对 于 便 fault 来 说 ， 有 可 能 束 是 因为 SP 指针 指 飞 了 干扰、 堆栈 溢出 等 ) ， 以 致 前 面 的 
堆栈 操作 触发 了 本 次 便 fault， 再 操作 堆栈 还 不 当场 被 秒杀 ? 如 下 面 代码 所 去 示 : 
hard_ fault handler 

PESH ftR4-R77ER+ ; 除非 确保 堆栈 是 安全 可 用 的 〈 谁 能 确保 ? ) ， 否 则 不 要 这 样 做 



































值 此 和 危难 关头 ， 必 须 沉着 冷静 。 在 我 们 设计 便 fault， 总 线 fault 以 及 存储 管理 fault 的 服务 例 程 时 ， 
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值得 先 花 点 工夫 去 查 一 查 SP 的 值 ， 看 它 是 否 在 可 接受 的 范围 ， 然 后 再 做 后 续 工 作 。 对 于 NMI 服 务 例 
程 来 说 ， 它 做 的 通常 是 应 急 工 作 ， 设 计 系 统 时 就 应 该 让 这 种 应 急 工作 极 简单 〈 比 如 ， 只 改变 一 个 MO 
脚 的 电 平 ， 最 多 也 就 是 修改 若干 寄存 器 的 值 ， 就 可 以 开启 相关 的 应 急 人 硬件 一 一 译 者 注 ) ， 因 此 常常 
可 以 只 使 用 R0-R3 以 及 R12 就 完全 够 用 ， 无 需 堆 栈 操 作 。 

简化 硬 faut 和 NMI 的 服务 例 程 确 实 是 个 好 主意 : 它们 只 做 必需 的 ， 然 后 悬 起 PendSsV， 让 诸如 错 
误 报告 等 其 它 工 作 在 PendSvV 中 处 理 ， 当 然 ， 软 件 中 断 兴 许 也 能 凑 和 着 用 。 

除 此 之 外 ， 我 们 还 必须 杜绝 在 便 NMI/fault 例 程 中 使 用 svVC 指 令 ， 这 也 是 斩 立 决 的 一 一 因为 SVC 的 
优先 级 总 是 没有 NMI 和 便 fault 的 高 ， 而 且 它 又 不 允许 悬 起 〈 巧 起 时 触发 fault) 。 这 看 起 来 很 容易 做 
到 ， 那 是 饱 汉 不 知道 饿 汉 饥 一 一 当 程 序 变 得 复杂 ， 并 且 如 果 NMU 硬 fault 服 务 例 程 中 调用 了 其 它 目 标 
文件 中 的 函数 ， 就 不 能 保证 这 些 函 数 中 没有 使 用 过 SVC。 因 此 ， 在 开发 软件 时 ， 必 须 仔 细 地 计划 如 
何 实现 SVC。 或 者 获取 所 调用 函数 的 说 明文 档 ， 确 保 不 会 出 事 。 
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Cortex-M3 的 其 它 特 性 


SysTick 定时 器 
电 源 管理 

多 处 理 机 通信 

目 复 位 控制 


到 了 这 里 ， 我 们 已 经 学 完了 CM3 的 绝 大 多 数 重要 和 基础 的 特性 ， 再 加 一 把 劲 儿 ， 这 章 不 难 ， 过 
了 以 后 就 到 了 一 个 里 程 碑 了 。 








13.1 SysTick 定时 器 








回顾 第 8 章 讲述 NVIC 时 ， 曾 走马 观 花 地 带 过 了 SysTick 定时 器 。 复 习 一 下 : SysTick 是 一 个 
24 位 的 倒 计 数 定时 器 ， 当 计 到 8 时， 将 从 RELOAD 寄存 器 中 自动 重 装载 定时 初 值 。 只 要 不 把 它 在 
SysTick 控制 及 状态 寄存 堪 中 的 使 能 位 清除 ， 驶 永 不 停 县 。 几 13.1 中 小 结 了 SysTick 的 相关 寄存 
人 








NOREF SKEW 
31 


23 16 0 
| 周 TENMS 

OxE000E018 当前 值 寄存 器 | CURRENT 
0xE000E014 重 装载 值 寄存 器 I RELOAD 


0xE000E010 控制 及 状态 寄存 器 





0xE000E01C 校准 寄存 器 


Enable 


COUNTFLAG TICKINT 
CLKSOURCE 


13.1 SysTick 相关 寄存 器 的 定义 


CM3 允许 为 SysTick 提供 两 个 时 钟 源 以 供 选 择 。 第 一 个 是 内 核 的 “上 自由 运行 时 钟 ”FCLK。 引 
由 ”表现 在 它 不 来 自 系 统 时 钟 HCLK， 因 此 在 系统 时 钟 停止 时 FCLK 也 继续 运行 。 第 二 个 是 一 个 外 部 
的 参考 时 钟 。 但 是 使 用 外 部 时 钟 时 ， 因 为 它 在 内 部 是 通过 FCLK 来 采样 的 ， 因 此 其 周期 必须 至 少 是 
FCLK 的 两 倍 〈( 玉 样 定理 )。 很 多 情况 下 心 厂矿 商都 会 忽略 此 外 部 参考 时 钟 ， 因 此 通常 不 可 用 。 通 过 
检查 校准 寄存 器 的 位 [31] (NOREF)， 可 以 判定 是 否 有 可 用 的 外 部 时 钟 源 ， 而 芯片 厂商 则 必须 把 该 引 
线 连接 至 正确 的 电 平 。 

当 SysTick 定时 器 从 1 计 到 8 时 ， 它 将 把 COUNTFLAG 位 置 位 ;而 下 述 方法 可 以 清 零 之 : 

该 取 SysTick 控制 及 状态 寄存 器 〈STCSR ) 

往 SysTick 当前 值 寄存 器 〈STCVR) 中 写 任何 数据 

SysTick 的 最 大 使 合 ， 就 是 定期 地 产生 异常 请 求 ， 作 为 系统 的 时 基 。0Ss 都 需要 这 种 “滴答 ”来 
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推动 任务 和 时 间 的 管理 。 如 欲 使 能 SysTick 异 钟 ， 则 把 STCSR.TICKINT 置 位 。 另 外 ， 如 采 把 同 量 
表 重 定位 到 了 SRAM 中 ， 还 需要 为 SysTick 寞 党 建立 同 量 ， 提 供 其 服务 例 程 的 入 口 地 址 ， 如 下 段 代 
码 所 演示 : 

; 建 六 SysTick 寞 常服 务 例 程 











MOV RO, #0xF ; 开 帅 号 : 15 

LDR R1, =eVestliek handler ; 加 载 服 务 例 程 的 入 口 地 址 

LDR RZ =0xE000ED08 ; 加 载 辐 量 表 偶 移 量 寄存 器 的 地 址 
LDR R2, [R2] ; 读 取 问 量 表 的 首 地 址 

STR R1, 2 ee ; 写 入 问 量 





下 面 的 代码 演示 启用 SysTick 的 基本 程序 


; 使 能 SysTick 定 时 器 ， 并 日 使 能 SsysTick 寞 常 





LDR RO, =0xE000E010 ; 加 载 STCSR 的 地 址 

MOV R1, #0 

STR 民政 [RO] ; 先 停止 SysTick， 以 防 意 外 产生 异常 请 求 

LDR 家 =0x3FF ; 让 SysTick 每 1024 周 期 计 完 一 次 。 因 为 是 从 1023 数 到 
; 0， 总 共 数 了 1024 个 周期 ， 所 以 加 载 值 为 0x3FF 

STR RL [RO, #4] ; 写 入 重 北 载 的 值 

STR RE, [RO, #8] ; 往 sTCVR 中 写 任意 的 数 ， 以 确保 清除 COUNTFLAG 标 志 

MOV R1, #0x7 ; 选择 FCLK 作 为 时 钟 产 ， 并 使 能 SysTick 及 其 下 单 请 求 

STR R1, [RO] ; 写 入 数值 ， 开 局 定时 器 


除 此 之 外 ，SysTick 定时 器 还 提供 了 走 完 16ms 所 需要 的 格 数 (TENMS 位 段 )， 作 为 时 间 校 准 的 
参考 信息 。 在 CM3 处 理 占 的 项 层 有 一 个 24 位 的 输入 ， 蕊 片 厂商 可 以 写 入 一 个 16ms 的 加 载 值 ， 写 程 
序 时 束 可 以 谈 取 STCR 寄存 器 中 的 TENMS 位 段 来 获取 此 信息 。 不 一 定 每 个 必 片 都 实现 了 此 功能 ， 
此 在 使 用 时 还 需 得 阅 必 片 的 数据 手册 。 

SysTick 定时 费 还 可 以 用 作 闸 钟 ， 作 为 局 动 一 个 特定 任务 的 时 间 依 据 。 例 如 ， 如 有 果 和 需要 在 366 
周期 后 执行 一 段 代码 ， 束 可 以 在 SysTick 寞 津 服 务 例 程 中 设置 执行 那 段 代码 的 软件 标志 。 使 用 
SysTick 时 ， 清 零 CURRENT 再 编程 RELOAD 寄存 器 ， 以 使 它 在 366 周期 后 产生 开 篆 ， 如 下 述 代码 所 



































演示 : 
LDR 到 加 ， = 
LDR 下 由 =SysTickAlarm  ; SysTick 措 常服 务 例 程 为 SetupExcpHanler 
BL SetupExcpHandler ; 调用 前 面 章 市 讲 到 的 子 程 来 建立 问 量 
LDR RO, =0xE000E010 ; SysTick 寄 存 右 组 的 基地 址 
MOV R1, #0 ; 编程 前 先 除 能 SysTick 
STR R1, [RO] 
STR R1, [RO, #0x8] ; 清 零 CURRENT 
LDR R1, = (300-12) ; 设置 装载 值 。 减 去 12 是 为 了 补偿 中 延迟 
STR = [RO, #0x4] ; 写 入 RELOAD 
LDR R4, =SysTickFired  ; 在 RAM 中 的 一 个 变量 ， 指 示 是 计时 a 到 期 
MOV R5, #0 ; 初始 为 0 
STR R5, [R4] 
MOV R1, #0x7 ; 使 用 FcCLK， 使 能 SysTick， 使 能 SysTick 异 常 
STR R1, [RO] ; 启动 计时 
LDR R4, SysTickFired 
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WaitLoop 


LDR RSy [R4] ; 循环 碍 询 软件 标志 
CMP R5, #0 
BEO WaitLoop 





; SysTickFired 在 服务 例 程 中 被 置 位 ， 主 程序 可 以 继续 执行 
本 例 中 使 用 以 前 讲 到 的 SetupExcpHandler 来 建 并 同 量 表 , 但 注意 : 必须 重 定 位 同 量 表 人 到 RAM 
中 才 行 

















ee。 
; 入 口 条 件 : RO = 异 各 扎 
口 条 件 : R1 = 弄 和 党 服务 例 程 
PUSH OLR] 
LDR 民 2 =NVIC_VECTTBL 
LDR R25 [R2] ; 读 取 辣 量 表 的 地 址 
STR.W Rl1, [R2, RO LSED $F$2] ; 表 中 [R2+R0<<2] 的 位 置 束 是 为 该 同 量 的 
POP TO. 人 ; 快速 返回 


因为 计数 器 是 从 8 开始 计数 的 , 所 以 它 会 立即 把 366-12 加 载 入 CURRENT。12 是 中 断 啊 应 的 最 
短 延 时 ， 因 此 减 去 它 用 以 补偿 。 但 是 如 采 有 更 高 优先 级 的 卉 第 抢占 或 者 阴 圭 了 和 它 ， 则 中 断 延 到 还 是 
会 有 的 。 

另外 要 注意 的 , 减 去 12 只 适用 于 一 次 性 (one shot ) 的 闭 钟 操作 ,在 这 种 情况 下 必须 在 SysTick 
服务 例 程 中 按 停 这 个 sysTick。 进 一 步 地 ， 如 条 其 它 开 第 把 它 延 到 得 太 久 ， 承 有 可 能 会 使 SysTick 
异 和 被 巧 起 两 次 。 因 此 ， 对 于 单 次 处 理 时 ， 还 需要 其 它 一 些 步骤 来 消灭 二 次 触发 : 


SysTickAlarm ; SYSTICK exception handler 



































PUSH {LR} 
LDR RO, =0xE000E010 ; SYSTICK 寄 存 器 组 的 基地 址 
MOYV R1, #0 
STR Roly [ROJ ; 除 能 sysTick， 因 为 只 使 用 一 次 
LDR RO, =0xE000EDO4 
LDR R1, =0x02000000 ; 手工 清除 NVIC 中 的 SysTick 惹 起 位 
STR Rl1, [RO] 
; 执行 所 需 的 处 理工 作 
LDR R2y =SysTickFired 
LDR R1， [R21] 
ORR R1, #1 
STR RL IR ; 设置 软件 标志 ， 与 主 程序 同步 ， 以 执行 任务 
DOB {BC ; 开关 返回 


在 服务 例 程 的 末尾 处 ， 通 过 设置 sysTickFired 标志 ， 通 知 主 程序 定时 已 经 到 期 ， 可 以 结束 循 
环 等 竺 了。 


13.2 电 涯 官 理 


不 同 于 以 往 的 处 理 右 ，CM3 对 电源 定理 的 重视 ， 己 经 上 升 到 处 理 右 内 核 的 水 平 上 。 它 提供 了 寿 
两 种 睡 虑 模式 。 在 睡 虑 时 ,可 以 集 止 系统 时 钟 , 但 可 以 让 FCLK 继续 走 ， 以 允许 处 理 右 能 被 SysTick 
寞 党 唤醒 。 这 两 种 睡 上 肪 模式 依次 为 : 

睡眠 : 由 CM3 处 理 喜 的 SLEEPING 信号 指示 
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深度 睡眠 : 由 CM3 处 理 需 的 SLEEPDEEP 信和 号 指示 

为 了 判定 当前 使 用 的 是 哪 一 种 睡眠 模式 ， 以 及 其 它 睡眠 时 的 上 下 文 ， 需 要 检视 在 NVIC 的 系统 
控制 寄存 器 ， 如 表 13.1 所 示 。 要 注意 ，CM3 的 这 两 条 信号 线 是 给 芯片 设计 者 看 的 ， 需 要 芯片 设计 
者 配合 它们 作 一 系列 的 处 理 ， 因 此 不 同 的 芯片 ， 响 应 这 两 种 睡眠 模式 的 方式 也 是 不 同 的 。 粗 线条 的 
实现 可 能 把 它们 两 个 等 同 处 理 也 说 不 定 。 
表 13.1 系统 控制 寄存 器 (地 址 : 6xE666_ED16) 














位 段 ”名 称 类 型 ”复位 值 描述 
4 SEVONPEND RW - 发 和 后 民间 县 起 时 将 发 送 事件 。 在 使 用 WFE 指令 睡 





眠 后 , 此 位 可 以 使 得 狐 悬 起 的 中 断 把 CM3 从 WFE 
指令 处 唤醒 。 不 管 这 个 中 断 的 优先 级 是 否 比 当前 
的 局， 都 唤 醒 。 


3 保留 - 
2 SLEEPDEEP R/W 0 当 进 入 睡眠 模式 时 ， 使 能 外 部 的 SLEEPDEEP 信 
号 ， 以 允许 停止 系统 时 钟 
1 SLEEPONEXIT R/W  - 激活 “SleepOnExit” 功 能 
保留 - = = 





通过 执行 WFI/WFE 指令 ， 请 求 CM3 进入 睡眠 模式 ， 它 们 在 CM3 中 的 地 位 束 类 似 于 某 些 处 理 占 
的 ”sleep/slp” 指 令 。WFI 表示 Wait-For-Interrupt， 而 WFE 表示 Wait-For-Event。 那 么 什么 
可 以 算是 event 呢 ? 新 来 的 中 断 、 早 先 被 巧 起 的 中 断 ， 或 者 是 通过 RXEV 信号 表示 的 一 个 外 部 事件 
信号 脉冲 ， 都 属于 event。 在 处 理 内 部 ， 对 事件 有 一 个 锁 存 器 ， 因 此 过 去 发 生 的 事件 可 以 用 来 唤醒 
将 来 才 执 行 到 的 WFE。 流 程 如 图 13.2 所 示 。 












清除 事件 锁 存 器 
青 除 事件 锁 存 器 事件 锁 存 器 -1? 


清除 事件 锁 存 器 ， 然 后 
执行 下 一 条 指令 


进入 普通 睡眠 进入 深度 睡眠 
SLEEPING 信 和 号 线 为 高 SLEEPING 和 SLEEPDEEP 
SLEEPDEEP 则 为 低 信号 线 将 都 被 置 高 


13.2 进入 睡眠 模式 的 序列 

当 处 理 器 进入 睡眠 模式 时 ， 单 片 机 作 如 何 反 应 ， 还 取决 于 芯片 的 设计 。 最 典型 的 作法 就 是 把 一 
些 外 设 的 时 钟 停 反 以 降低 功 耗 。 当 然 ， 忆 片 还 可 以 做 得 更 有 力 ， 切 断 一 部 分 功能 模块 的 电源 ， 甚 至 
切断 整个 心 片 的 电源 并 且 停 止 所 有 的 时 钟 。 这 是 把 事情 做 绝 了 ， 只 能 通过 复位 来 唤醒 。 为 此 ， 艺 斤 
厂商 可 以 在 单片机 上 提供 一 个 引 脚 ， 并 根据 它 的 电 平 变化 来 产生 此 复位 信和 与 。 为 外 ， 蕊 厂矿 隘 还 可 
以 在 设计 时 加 入 少量 的 SRAM 作为 后 备 存储 区 ， 该 区 电力 供应 不 被 切断 (如 STM32)， 以 供应 用 程序 
在 轮回 前 ， 先 把 今生 离别 之 际 的 一 些 重 要 上 下 文 存 入 ， 待 到 来 世 再 报恩 。 

WFI/WFE 除了 进入 睡 虐 的 序列 不 同 外 ， 它 们 的 唤醒 行为 也 有 所 不 同 。 

当 从 WFI 唤醒 时 ， 要 根据 异 弟 系统 的 游戏 规则 来 决定 是 否 唤醒 。 只 有 当 该 中 断 的 优先 级 比 当前 
优先 级 要 高 〈 如 果 是 在 服务 例 程 中 使 用 WFI)， 并 且 比 BASEPRI 掩蔽 的 高 时 ， 才 唤醒 处 理 器 并 执行 
ISR。 但 如 果 PRIMASK 置 位 ， 则 依然 唤醒 处 理 右 ， 然 而 ISR 却 不 执行 了 。 

WFE 则 有 点 区 别 ， 不 管 优 先 级 和 掩蔽 情况 如 何 ， 只 要 SETONPEND 置 位 ， 它 就 会 不 错过 任何 一 个 
事件 ， 在 发 生 事件 时 一 定 把 处 理 器 唤醒 。 人 至 于 是 否 执行 ISR， 则 与 WFI 的 规则 相同 。 
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CM3 处 理 器 唤醒 的 具体 规则 如 表 13.2A 和 表 13.2B 所 示 。 但 要 注意 : 这 是 假设 中 断 的 优先 级 比 
当前 优先 级 要 高 的 〈 即 没有 在 异常 服务 例 程 中 使 用 WFI/WFE， 谁 在 这 里 用 谁 想不开 )。 
表 13.2ANFI 的 唤醒 行为 〈 带 “+” 的 表示 执行 此 动作 ) 


中 全 移 朋 





PRIMASK=1， 且 BASEPRI 不 能 掩蔽 二 
PRIMASK=1， 朋 BASEPRI 能 够 掩蔽 


表 13.2BWFE 的 唤醒 行为 〈 带 “+” 的 表示 执行 此 动作 ) 


PRIMASK=6，SEVONPEND=1， 日 BASEPRI 不 能 
捧 蔽 


PRIMASK=6，SEVONPEND=1， 日 BASEPRI 能 够 
掩蔽 


PRIMASK=1，SEVONPEND=1， 朋 BASEPRI 不 能 
捧 蔽 


PRIMASK=1，SEVONPEND=1， 朋 BASEPRI 能 够 
捧 蔽 





译 者 小 结 : 
1. 只 有 PRIMASK=6 时 ， 才 执行 ISR 
2. 对 于 WFE， 只 要 SEVONPEND=1， 则 不 管 何 时 发 生 了 什么 中 断 ， 都 一 定 会 唤醒 处 理 峰 
3. 不 管 PRIMASK 为 何 值 ， 只 要 优先 级 高 到 BASEPRI 不 能 掩 没 ， 束 将 唤醒 处 理 器 
4. 当 PRIMASK=6 时 ， 它 不 会 对 唤醒 产生 影响 

CM3 还 有 一 个 “自动 睡眠 ”的 机 制 : SleepOnExit 一 一 它 可 以 被 编程 为 从 中 断 服 务 例 程 返回 后 
立即 睡眠 。 这 样 一 来 ， 处 理 器 的 所 有 工作 束 只 是 响应 中 汤 了 ， 其 它 时 间 都 在 睡 虑 。 在 真实 的 应 用 程 
序 里 ， 通 第 只 有 在 程序 很 简单 的 电池 供电 设备 中 ， 才 会 用 此 功能 。 如 欲 使 用 此 特性 ， 需 要 把 系统 控 
制 寄 存 器 中 的 SLEEPONEXIT 位 置 位 。 如 图 13 .3 所 示 。 
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WFI/WFE 






唤醒 并 且 运 行 
中 断 服务 例 程 


SLEEPONEXIT=1? 


继续 执行 下 一 条 指令 


13.3 SleepOnExit 功能 演示 


13.3 多 处 理 机 通信 


最 让 人 意 想 不 到 的 就 是 CM3 竟然 还 文 持 人 简单 的 多 核 功 能 ! 它 上 面 有 一 个 用 于 处 理 机 之 间 同 步 任 
务 的 简单 通信 和 接口。 处 理 机 有 一 个 名 为 TXEV (Transmit Event) 的 输出 信号 ， 用 于 发 送信 号 给 其 
它 处 理 机 ， 还 有 一 个 名 为 RXEV (Receive Event) 的 输入 信号 ， 以 接收 从 其 它 处 理 机 发 来 的 信和 号 。 
对 于 一 个 双核 系统 来 说 ， 事 件 通信 的 信号 的 连接 可 以 如 图 13 .4 所 示 : 


TXEV 
Cortex-IM3 #1 \) 
RXEV 


13.4 双核 处 理 系 统 间 的 事件 信号 连接 
如 上 一 小 节 所 述 ， 当 处 理 机 因为 WFE 而 睡眠 时 ， 可 以 由 外 部 事件 一 一 即 RXEV 唤醒 。CM3 提供 
了 SEV 指令 (Send EVent)。 当 执行 该 指令 时 ， 当 事 处 理 机 就 会 在 TXEV 上 发 送 一 个 脉冲 ， 从 而 可 
以 唤醒 另外 的 睡眠 中 的 处 理 机 ， 从 而 实现 同步 ， 如 图 13.5 所 示 。 
























Cortex-M3 #2 
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处 理 机 #2 


处 理 机 #1 的 SLEEPING 四 


检测 到 处 理 机 #1 
进入 睡眠 状态 


处 理 机 #1 


执行 WFE 指 令 


信号 线 被 置 为 有 效 


有 | 


睡眠 中 


发 现 需要 和 处 理 机 #1 


司 步 来 完成 一 个 任务 


执行 SEV 指令 


处 理 机 #2 的 TXEV 
信号 线 上 产生 脉冲 
处 理 机 #1 在 RXEV 
上 接收 到 此 脉冲 





从 睡眠 中 被 唤醒 
检查 任务 状态 


执行 任务 


执行 任务 





图 13.5 双核 之 间 使 用 事件 信号 来 做 同步 任务 


在 使 用 WFE 同步 任务 时 ， 要 明日 处 理 融 也 以 被 其 它 事件 唤醒 ， 比 如 中 断 和 调试 事件 。 所 以 在 被 
唤醒 时 ， 需 要 先 检 碍 是 不 是 由 同步 事件 信号 唤醒 的 。 使 用 WFE 同步 任务 的 流程 如 图 13 .6 所 示 。 











195 


Cortex-M3 权威 指南 第 13 章 


WFE 


睡眠 


被 唤醒 
是 被 竺 同步 的 


” 任务 唤醒 的 吗 ? 





Yes 还 有 其 它 待 同 
步 的 任务 吗 ? 


No 


退出 循环 
13.6 使 用 WFE 同步 任务 模式 图 


通过 使 用 WFE， 我 们 可 以 让 两 个 处 理 机 同步 地 配合 完成 一 个 任务 也 可 能 会 有 少量 时 钟 周期 的 
时 送 ， 这 取决 于 右 件 的 实现 方式 )。 上 图 演示 的 是 两 台 处 理 机 的 迟 况 ， 事 实 上 处 理 机 的 数目 并 没有 
限制 ， 但 无 论 如 何 都 必须 有 一 个 担当 “主机 ”用 于 发 送 同步 事件 。 

当 执 行 WFE 时 ， 它 痛 和 完 检 人 视 本 地 事件 锁 存 旧 。 如 果 锁 存 右 的 值 为 零 ， 则 使 内 核 睡眠 ， 如 来 发 现 
锁 住 了 先前 的 事件 信号 ， 则 清 零 锁 存 占 ， 并 且 取 消 此 次 睡 虐 ， 继 续 执 行 下 一 条 指令 。 早 完 发 生 的 弄 
意 、 执 行 的 SEV 指令 都 可 以 置 位 锁 存 项 。 所 以 要 注意 ， 如 宁 曾 经 执行 过 SEV， 则 罕 控 看 的 WFE 不 会 
使 处 理 需 睡 瞧 ， 只 是 清除 了 锁 存 的 值 ， 处 理 磊 依然 继续 执行 。 


13.3.1 多 机 同步 的 深入 讨论 


事实 上 ， 同 步 问 题 远 远 要 复杂 得 多 。 如 果 只 是 按 图 13.6 那样 单单 使 用 WFE， 只 能 应 付 小 儿科 
的 任务 同步 问题 ,在 复杂 的 应 用 程序 中 , 为 正确 地 同步 任务 还 需要 附加 的 代码 ,正如 上 文 所 提 到 的 ， 
处 理 右 也 以 被 其 它 事件 唤醒 ， 比 如 中 断 和 调试 事件 。 因 此 ， 内 部 的 事件 寄存 器 的 当前 状态 常常 是 未 
知 的 ， 故 而 不 能 保证 在 执行 WFE 指令 后 就 一 定 能 进入 睡眠 。 事 实 上 ，WFE 常常 在 循环 中 使 用 (用 于 
降低 系统 的 功 耗 )， 循 环 体 中 的 代码 检查 状态 ， 以 判定 需要 同步 的 任务 是 否 应 该 在 WFE 后 执行 。 

这 种 用 法 最 典型 示例 就 是 多 核 系 统 中 的 信号 量 。 在 典型 的 情况 下 ， 需 要 一 个 系统 级 的 互 斥 访问 
监视 堪 ， 在 它 的 辅助 下 使 用 互 斥 访问 指令 来 实现 自 旋 锁 (spin lock， 熟 悉 Linux 的 读者 请 给 我 你 
们 的 微笑 )， 以 一 轮 一 轮 地 尝试 锁 住 共享 的 存储 器 或 外 设 。 自 旋 锁 设施 由 RTOS 提供 ,通常 由 汇编 语 
言 写 成 。RTOS 提供 类 似 spin lock() 和 spin_unlock() 的 函数 (如 :Linux)， 而 任务 则 可 以 使 用 
这 两 个 函数 来 锁 住 所 需 的 共享 资源 。 













































































196 


Cortex-M3 权威 指南 


第 规 的 目 旋 锁 代 码 如 下 所 示 : 


SPDIn_ lock 


MOVS EE #1 
spin _ lock loop 

LDREX rl, [ro0O] 

CMP 区 #0 

BNE spin_ lock loop 

STREX. 证 Ly 生 2;): 下 人 日 ] 

CMP 基地 #0 

BNE spin_ lock loop 

DMB 

BX LR 


r 


/ 


第 13 章 





获取 目 旋 锁 的 汇编 示例 代码 ，z0 指向 目 旋 锁 变量 
r2 竺 会 要 写 入 目 旋 锁 变量 ， 表 示 资 源 已 锁 





资源 已 极 锁 住 ， 需 重 试 
使 用 STREX 指令 尝试 设置 Lock_Variable 为 1 
检查 STREX 指令 的 返回 值 
STREX 指令 没有 成 功 执行 ， 重 试 
执行 数据 存储 器 隔离 ， 以 确保 数据 已 洛 实 到 物理 内 存 中 。 
返回 


在 共 孚 资源 使 用 完毕 后 ， 需 要 释放 目 旋 锁 : 


spin unlock 


MOVS rl, #0 
STR rili, [Ir0] 
DMPB 

BX LR 





r 


r 


r 


r 





释放 目 旋 锁 的 汇编 示例 代码 ，r0 指向 目 旋 锁 变 量 


: Clear lock 


执行 数据 存储 右 隅 离 ， 以 确保 数据 已 落实 到 物理 内 存 中 。 
返回 


目 旋 锁 的 副作用 ， 束 是 会 当 【〔 获 取 锁 的 ) 处 理 机 至 闲 时 使 “等 待 锁 的 ) 处 理 机 白白 容 转 ， 浪 费 
能 源 。 因 此 , 我 们 在 上 例 的 自 旋 锁 中 加 入 WFE/SEV 来 解决 这 个 问题 ; 一 方面 , 在 尝试 上 锁 的 函数 中 ， 
一 且 发 现 已 上 锁 就 执行 WFE; 而 在 释放 锁 的 函数 中 在 为 一 个 处 理 机 中 执行 此 函数 )， 释 放 后 执行 
SEV 指令 以 唤醒 所 有 演 试 上 锁 的 处 理 机 。 


spin_ Lock_wIth_ WEE 


r 


r 


MOVS  r2, #1 

spin_lock_ loop 
LDREX rl1, [六 | 
CBNZ ril, lock is set ，; 
STREX rl, r2, [r0] > 
CMP rl, #0 / 
BNE spin_ lock loop 
DMB / 
BX LR ; 


lock is_ set 
WE 了 


B spin_ lock_loop 


r 


/ 





使 用 WEE 配合 获取 目 旋 锁 的 汇编 示例 代码 ，r0 指 问 目 旋 锁 变 量 
r2 得 会 要 写 入 日 旋 锁 变量 ， 表 示 资 源 已 锁 





如 果 *11=0， 则 表示 已 上 锁 
使 用 STREX 指令 尝试 设置 Lock_Variable 为 1 
检查 STREX 指令 的 返回 值 
STREX 指令 没有 成 功 执行 ， 重 试 
执行 数据 存储 器 陋 离 ， 以 确保 数据 已 洛 实 到 物理 内 存 中 。 
返回 


; 资源 已 锁 。 等 竺 使 用 资源 的 处 理 机 杰 放 锁 后 使 用 SEV 发 出 信号 





被 唤醒 ， 不 管 是 不 是 被 SEV 唤醒 的 ， 先 去 尝试 上 锁 


在 共计 资源 使 用 完毕 后 ， 需 要 释放 目 旋 锁 : 
在 解 开 目 旋 锁 的 函数 中 ， 需 要 使 用 SEV 指令 来 唤醒 其 它 押 有 需要 该 锁 的 处 理 机 。 


spin _ unlock _ with _SEV 


MOVS rl,， #0 


4 











释放 目 旋 锁 的 汇编 示例 代码 ，z0 指 问 目 旋 锁 变 量 
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STR rl, [r0] ; Clear lock 


DMB ; 执行 数据 存储 器 隔离 ， 以 确保 数据 已 落实 到 物理 内 存 中 。 
SY 
BX LR ; Return 











通过 在 信和 与 量 代码 中 配合 使 用 事件 通信 接口 ， 束 可 以 在 使 用 目 旋 锁 尝 试 获 取 共 至 资源 时 消除 不 
必要 的 功 耗 。 类 似 的 技术 也 可 以 用 于 创建 消 恩 队列 等 其 它 任 务 同步 设施 。 

译 者 添加 : 自 旋 锁 不 是 谁 想 用 谁 就 能 用 的 ， 必 须 分 场合 。 如 果 是 同一 个 处 理 机 内 的 多 个 任务 需要 某 共享 资源 ， 
日 在 其 它 处 理 机 上 没有 需要 此 资源 的 任务 , 就 不 得 使 用 带 WFE 的 自 旋 锁 , 因为 在 执行 WFE 后 , 该 处 理 机 已 经 睡眠 了 ， 
无 法 再 执行 其 它 指令 ， 更 不 要 说 调度 其 它 任务 让 它 调用 spin_unlock_with_SEV 了 。 此 时 又 没有 “外 力 ” 因此 就 
很 可 能 要 “长 眠 ”了 ! 进一步 地 ， 单 机 场合 下 不 得 使 用 自 旋 锁 。 因 为 自 旋 锁 可 能 导致 死 循 环 : 优先 级 最 高 的 任务 如 
果 使 用 自 旋 锁 未 果 ， 则 在 按 优先 级 调度 的 RTOS 中 ， 如 果 没 有 有 反 优 先 级 倒转 机 制 ， 就 会 使 最 高 优先 级 的 任务 永远 死 
循环 ，CPU 利用 率 166%， 却 再 也 执行 不 了 其 它 任 务 ! 

在 大 多 数 CM3 系统 中 ， 会 只 使 用 一 个 内 核 。 此 时 ， 常 常 是 把 RXEV 脚 拉 低 ， 或 者 连接 到 其 它 可 
以 产生 事件 的 外 设 上 。 












































Cortex-M3 r2p0 修 tJ 版 新 增 


请 注意 : 当 使 能 了 SLEEPONEXIT 特性 时 ，CM3 在 异常 退出 后 不 经 过 执行 WFI/WFE 就 会 
进入 睡眠 模式 。 因 此 当 需 要 执行 睡眠 时 , 在 正常 的 使 用 场合 下 ,要 在 WFI/WFE 指令 (得 
到 执行 ) 之 前 就 使 能 SLEEPONEXIT。 

在 Cortex-M3 修订 版 2( 已 于 2668 年 出 品 ) 中 , 又 添加 了 新 的 特性 以 文 持 低 功 耗 。 
从 软件 的 立场 上 来 看 ，WFI/WFE 依然 故我 。 但 在 硬件 上 上， 修订 版 的 深度 睡眠 模式 则 睡 
得 更 深 : 允许 送 往 处 理 器 内 核 的 时 钟 信 号 停止 。 那 这 么 一 来 怎样 唤醒 内 核 呢 ? 了 原 来 ， 修 
订 厂 2 的 内 核 新 增 了 一 个 独立 的 单元 ， 称 作 “ 唤 醒 中 断 控 制 右 2?。 有 了 它 ， 处 理 嚣 内核 
可 以 在 进入 挥 电 模式 时 ， 把 处 理 器 状态 信息 存储 到 特殊 的 逻辑 小 室 〈cells) 中 ， 从 而 
更 狠 地 降低 空闲 时 的 功 耗 。 

要 使 用 新 的 挥 电 模 式 , 还 需要 一 个 外 部 电源 管理 单元 来 配合 , 后 者 用 于 控制 上 电 序 
列 和 挥 电 序 列 。 该 单元 由 心 片 供应 商 提 供 , 在 使 用 挥 电 特 性 前 可 能 还 要 编程 它 ， 因 此 和 害 
要 参考 心 片 供应 商 提 供 的 技术 文档 。 关 于 挥 电 特 性 ， 还 有 两 点 要 注意 的 。 站 和 完 ， 是 它 会 
关 掉 送 往 SysTick 定时 器 的 时 钟 。 第 2， 当 连接 了 一 个 调试 器 时 ， 为 了 使 它 能 够 正常 
地 访问 调试 寄存 右 ， 会 目 动 除 能 这 个 拯 电 特性 。 















































13.4 目 复位 控制 


CM3 人 允许 由 软件 触发 复位 序列 ， 用 于 特殊 的 调试 或 维护 目的 《没事 别 玩 啊 )。 在 CM3 中 ， 有 两 
种 方法 可 以 执行 自我 复位 。 第 一 种 方法 ,是 通过 置 位 NVIC 中 应 用 程序 中 断 与 复位 控制 寄存 器 (AIRCR) 
的 VECTRESET 位 《位 偏 移 : 6)， 如 下 所 示 : 








LDR RO, =0xEOO0O0EDOC ; NVIC AIRCR address 
LDR = =0x05FA0001 ; 置 位 VECTRESET 人 位， 前 面 的 0x05FA 是 访问 钥 是 
STR R1, [RO] ; 触发 复位 序列 

deadloop 
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B deadloop ; 该 死 循环 保证 后 面 的 指令 不 可 能 被 执行 到 

这 种 复位 的 作用 范围 履 新 了 整个 CM3 处 理 磊 中 ， 除 了 调试 则 和 辑 之 外 的 所 有 角落 ， 但 是 它 不 会 影 
啊 到 CM3 处 理 喜 外 部 的 任何 电路 ， 所 以 单 户 机 上 的 各 上 户 上 外 设 和 其 它 电 路 都 不 受 影 啊 。 

复位 的 第 二 种 方法 ， 是 置 位 同一 个 寄存 器 中 的 SYSRESETREQ 位 。 这 种 复位 则 会 波及 整个 心 
上 的 电路 : 它 会 使 CM3 处 理 避 把 送 往 系统 复位 发 生 喜 的 请 求 线 置 为 有 效 。 但 是 系统 复位 发 生 器 不 是 
CM3 的 一 部 分 ， 而 是 由 必 族 广 商 实现 ， 因 此 不 同 的 必 卢 对 此 复位 的 啊 应 也 不 同 。 因 此 ， 谈 者 需要 认 
真 参 阅 该 必 帮 规格 书 ， 明 白 当 发 生 户 内 复位 时 ， 各 外 设 和 功能 模块 都 会 回 到 什么 样 的 初始 状态 ， 或 
者 有 哪些 功能 模块 不 受 影响 〈 比 如 ，STM32 系列 的 必 户 有 后 备 存 储 区 ， 该 区 惑 家 特殊 对 行 )。 
SYSRESETREQ 的 使 用 如 下 和 而 代码 段 所 渤 示 : 

































































LDR RO, =0xEOO0O0EDOC ; NVIC AIRCR address 
LDR R1, =0x05FA0004 ; 置 位 SYSRESETREQ， 前 面 的 0x05FA 是 访问 钥匙 
STR R1, [RO] ; 触发 复位 序列 
deadloop 
B deadloop ; 该 死 循环 保证 后 面 的 指令 不 可 能 被 执行 到 








大 多 数 情况 下 ， 复 位 发 生 器 在 响应 SYSRESETREQ 时 ， 它 也 会 同时 把 CM3 处 理 器 的 系统 复位 信 
号 (SYSRESETn) 置 为 有 效 。 通 常 ，SYSRESETREQ 不 应 复位 调试 逻辑 。 

这 里 有 一 个 要 注意 的 问题 : 从 SYSRESETREQ 被 置 为 有 效 ， 到 复位 发 生 器 执行 复位 命令 ， 往 往 
会 有 一 个 延 时 。 在 此 延 时 期 间 ， 处 理 喜 仍然 可 以 啊 应 中 断 请 求 。 但 我 们 的 本 意 往往 是 要 让 此 次 执行 
到 此 为 止 ， 不 要 再 做 任何 其 它 事情 了 。 上 所 以 ， 最 好 在 发 出 复位 请 求 朋 ， 先 把 FAULTMASK 置 位 。 
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仔 依 保护 时 元 MPU 


译 者 提示 : MPU 是 CM3 的 选 配 件 ， 许 多 CM3 单 片 机 中 都 没有 加 入 。 本 章 在 翻译 时 ， 对 原文 改编 比 其 
它 章 节 要 强烈 ， 且 有 一 部 分 内 容 译 自 “ 古 文 观 止 ”。 如 果 时 间 不 富裕 ， 读 者 可 以 选择 跳 计 。 


MPU 概览 
MPU 的 寄存 右 组 
启用 MPU 
MPU 的 典型 设置 


14.0 详 痢 添加 的 5| 子 
MPU 进入 单片机 还 是 很 新 鲜 的 事 ， 为 了 让 读者 预先 对 它 更 有 一 点 认识 ， 译 者 加 入 了 引文: 


5| 子 1: 最 指 夺 与 C 语言 


回顾 一 下 ,什么 是 指针 ? 指针 在 内 存 中 实际 上 有 是 一 个 无 符号 整数 (unsigned int) ， 但 是 它 的 值 被 
赋予 特殊 的 解释 : 表示 变量 或 函数 的 地 址 。 所 以 才 被 形象 地 称 为 “指针 ”， 就 好 像 指 向 谁 家 似 的 。 
在 使 用 指针 前 ， 都 必须 先 让 它 指向 有 意义 的 ， 并 且 允 许 由 程序 使 用 的 实体 一 一 数据 和 代码 。 而 所 谓 
“ 野 指针 ”， 就 是 指 某 个 指针 变量 的 值 因 故 超出 合法 的 范围 ， 使 其 “ 枪 口 ” 乱 指 。 程 序 逻 辑 错 误 、 
数组 越界 、 堆 栈 溢 出 、 指 针 未 经 初始 化 、 对 缓存 与 缓冲 的 处 理 不 当 、 多 任务 环境 中 的 亲 乱 危 得 ， 其 
是 恶意 地 破坏 等 ， 都 可 以 制造 出 野 指针 。 如 果 使 用 野 指针 去 读 取 或 修改 内 存 ， 则 被 读 取 或 修改 的 
立 置 是 不 可 预料 的 。 前 者 导致 读 回来 的 都 是 垃圾 数据 ， 后 者 则 更 是 “ 血 口 喷 人 ”一 一 会 破坏 未 知 用 
途 的 数据 。 这 名 种 导致 系统 发 生 莫 名 其 妙 的 功能 紊乱 ,严重 时 会 使 系统 毫 无 征兆 , 没有 理由 地 失控 、 
机 








0 


野 指针 就 像 “ 肉 里 的 刺 ， 着 里 的 明 ” 一 般 : 一 个 野 指针 就 足以 崩溃 整个 系统 ， 而 且 极其 隐藏 ， 
很 难 通 过 症状 来 找 出 是 哪里 存在 野 指 针 , 甚至 都 不 能 判定 症状 是 否 因 野 指针 造成 (程序 大 了 其 它 bug 
也 很 多 ， 并 且 也 能 导致 相同 的 症状 ) 。 野 指针 的 发 作 概率 越 小 ， 就 越 隐藏 ， 后 患 也 越 无 穷 。 对 于 通 
党 的 单片机 系统 ， 是 没有 任何 办 法 来 防止 野 指针 的 破坏 的 ， 完 全 靠 程序 员 的 素质 和 自律 。 但 智者 千 
虑 ， 必 有 一 失 。 尤 其 是 当 程序 规模 变 得 很 大 时 ， 复 杂 度 会 呈 指 数 上 升 ， 千 头 万 绪 纠 缠 不 清 ， 就 算是 
谨慎 如 诸葛 亮 ， 聪 明 如 比尔 : 盖 英 的 天 才 ， 也 不 敢 保 证 没有 汤 网 之 鱼 。 

误 入 式 系统 开发 的 首选 语言 是 C 语言 。C 语言 的 指针 功能 非常 灵活 、 生 猛 、 物 获 不 驯 ， 它 是 电 ， 
它 是 光 ， 它 是 C 语言 中 最 闪 亮 的 “Supetr Star 。C 语言 允许 我 们 几乎 随心 所 欲 地 把 玩 各 种 地 址 ， 离 
汇编 语言 中 “放任 自流 ”的 程度 也 差 不 远 了 。 可 是 ， 要 是 像 汇编 那样 “ 明 坏 ” 倒 也 好 ,偏偏 C 语言 
中 的 指针 还 因为 语言 特性 附加 了 许多 十 分 微妙 的 “ 潜 规 则 ， 令 人 防不胜防 ; 更 加 暧昧 的 是 指针 与 
数组 的 关系 ， 一 维 数组 与 多 维 数组 的 关系 ， 多 维 数组 与 “星星 ”点 灯 的 关系 ， 指 针 与 ”出 ”的 二 重 
喝 ， 指 针 在 宏 中 使 用 时 极 易 弄巧成拙 的 暗箱 操作 ……: 用 C 语言 的 指针 功能 就 像 在 玩 一 场 勾魂 的 “ 野 
变 游戏 ， 不 知 不 觉 其 实 你 已 “上 线 ， 指 针 飞 姓 的 世界 战火 连天 ， 如 果 不 想 每 天 因 爆 发 了 却 查 不 出 
来 的 bug 而 以 泪 洗面 ， 提 高 警觉 快 张大 双眼 是 必要 的 ， 但 年 深 日 久 0 还 是 难免 有 看 不 清楚 而 迟早 粉 
身 碎 骨 的 时 候 。 在 系统 程序 的 开发 中 ， 指 针 更 是 满天飞 遍地 爬 ， 程 序 员 在 这 无 间 世 界 里 没有 想 过 要 
逃脱 ， 为 什么 要 逃脱 ? 完全 是 “你 主宰 ， 我 崇拜 ， 没 有 更 好 的 办 法 ， 只 能 爱 你 ，ut my supet star”。 
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这 里 再 说 句 题 外 话 。 如 果 读 者 不 站 与 被 C 语言 的 指针 给 泪 上 了 ， 就 要 特别 重视 内 功 的 修炼 。 除 
了 要 把 《C 程序 设计 》 以 及 《C 和 指针 》 夜 夜 放 在 床 关 外， 更 要 千方百计 地 弄 到 《C 陷阱 与 缺陷 》， 
以 及 《C 专家 编程 》 这 两 本 书 ， 它 们 两 个 堪 比 《黄花 宝典 》 和 《 九 阳 真 经 》。 


5| 子 2: 使 合 - 天 键 系统 


这 种 系统 往往 都 用 于 性 命 侯 关 的 场合 ， 且 必须 连续 无 故障 地 工作 ， 比 如 ， 火 车 调度 系统 、 生 命 
维持 系统 、 大 型 发 动机 了 驱动器、 核子 反应 堆 控 制 、 网 络 / 电信 的 数据 交换 中 枢 等 。 如 果 失 能 ， 将 导 
致 惨重 的 经 济 与 损失 ， 其 至 会 使 无 数 人 死 于 非 命 。 因 此 ， 决 不 允许 这 类 系统 出 现 上 述 情 况 。 然 而 ， 
这 些 系 统 的 复杂 度 往往 都 非常 高 ， 几 平 不 可 能 由 开发 人 员 保 证 这 种 可 靠 性 。 

因此 ， 需 要 在 硬件 水 平 上 加 入 一 个 “公安 机 关 。 通 过 它 设置 各 种 类 型 的 “禁地 ， 并 且 施 加 多 
种 规划 条例 。 一 旦 发现 违章 ， 则 强制 改变 执行 流 和 处 理 器 的 工作 状态 ， 以 便 可 以 由 软件 做 进一步 的 
处 理 。 这 样 ， 就 可 以 为 不 同 的 程序 限定 一 个 内 存 使 用 范围 ， 从 而 使 野 指针 或 恶意 破坏 无 法 影响 不 允 
许 访问 的 区 域 。 此 即 存 储 器 保护 单元 (MPU )。 

有 了 时， 对 存储 器 的 管理 更 进一步 ， 做 到 可 以 对 地 址 执行 变换 的 程度 ， 此 时 程序 使 用 的 地 址 未 必 
是 真实 的 存储 器 地 址 。 它 在 MPU 的 基础 上 ， 还 消灭 了 内 存 碎片 和 浪费 ， 并 且 能 进一步 地 让 应 用 程 
序 拥有 方便 舒适 的 地 址 空间 ， 从 而 使 程序 规模 可 以 扩大 甚至 数 百 倍 。 此 即 为 “存储 器 管理 单元 
(MMU)。 帝 MMU 的 系统 ， 往 往 也 带 cache,， 动态 RAM 等 。 这 种 系统 对 RAM 容量 的 计量 是 以 MB 
为 单位 的 。 可见 , MMU 是 一 个 对 处 理 器 定位 的 “分 水 岭 ”。 对 MMU 的 介绍 已 经 超出 了 本 书 的 范围 。 

(本 章 篇 幅 虽 然 较 长 ， 但 很 多 内 容 都 是 在 寄存 器 的 介绍 ， 以 及 示例 代码 的 反刍 上 ， 读 者 请 放松 阅读 ) 


14.1 MPU 概览 





在 Cortex-M3 处 理 兹 中 可 以 选 配 一 个 存储 此 你 护 单 元 MPU》〉， 它 可 以 实施 对 存储 占 ( 主 要 是 内 
存 和 外 设 寄存 器 〉 的 保护 ， 从 而 使 软件 更 加 健壮 和 可 徘 。 如 果 打 算 局 用 MPU， 则 在 使 用 前 ， 必 须根 
据 需 要 对 其 编程 。 如 果 没 有 局 用 MPU， 则 等 同 于 系统 中 没有 配 MPU。MPU 有 如 下 的 能 力 可 以 提高 系 
统 的 可 徘 性 : 
阻 止 用 户 应 用 程序 破坏 操作 系统 使 用 的 数据 
阻止 一 个 任务 访问 其 它 任 务 的 数据 区 ， 从 而 把 任务 隔 开 。 
可 以 把 关键 数据 区 设置 为 只 读 ， 从 根本 上 消除 了 被 破坏 的 可 能 。 
检测 意外 的 存储 访问 ， 如 ， 扒 栈 洪 出 ， 数 组 越界 。 
此 外 , 还 可 以 通过 MPU 设 置 存 储 需 regions 的 其 它 访 问 属性 ,， 比 如, 是否 绥 区 , 是 否 绥 冲 等 。 
MPU 在 执行 其 功能 时 ， 是 以 所 谓 的 “region” 为 单位 的 。 一 个 region 其 实 束 是 一 段 连 续 的 地 址 ， 
只 是 它们 的 位 置 和 范围 都 要 满足 一 些 限制 (对 章 方式 , 最 小 容量 等 ) 。CM3 的 MPU 共 文 持 8 个 regions。 
怎么 ， 嫌 少 ? 是 少 了 上 点， 不过， 还 允许 把 每 个 region 进 一 步 划 分 成 更 小 的 “ 子 region”。 此 外 ， 还 人 允 
许 启 用 一 个 “背景 region”“〈 即 没有 MPU 时 的 全 部 地 址 空间 ) ， 不 过 它 是 只 能 由 特权 级 至 用 。 在 局 
用 MPU 后 ， 就 不 得 再 访问 定义 之 外 的 地 址 区 则 ， 也 不 得 访问 未 经 授权 的 region。 奋 则 ， 将 以 “访问 
违例 ”处 理 ， 和 触发 MemManage fault。 

MPU 定 义 的 regions 可 以 相互 交 迭 。 如 果菜 块 内 存 洲 在 多 个 region 中 ， 则 访问 属性 和 权限 将 由 编 
号 最 大 的 region 来 决定 。 比 如 ， 若 1 号 region 与 4 号 region 交 欠 ， 则 交 失 的 部 分 受 4 号 region 控 制 。 


























~ 





14.2 MPU 的 寄存 器 组 








操作 MPU 是 通过 访问 它 的 名 干 寄存 鼎 来 实现 的 ， 如 下 表 所 示 。 
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( 译 者 注 : 此 表 摘 自 Cortex-M3 TRM) 
名 字 地 址 


MPU 控 制 寄存 器 MPUCR 0xe000,ed94 0x0000,0000 





让 我 们 来 详细 地 介绍 上 述 寄 存 颖 ， 第 一 个 束 是 MPU 类 型 寄存 器 (MPUTR) ， 如 表 14.1 所 示 


表 14.1 MPU 类 型 寄存 器 MPUTR (地 址 : 0xE 000 ED90) 





15:8 DREGION MPU 支持 的 数量 。 若 系统 中 配 了 MPU 则 为 8， 
否则 为 零 


从 表 中 我 们 可 以 看 出 ， 通 过 读 取 DREGION 的 值 ， 能 够 判断 芯片 中 是 否 配 了 MPU。 
接 下 来 我 们 看 一 看 MPU 控 制 寄存 如 MPUCR 如 表 14.2 所 示 


表 14.2 MPU 控制 寄存 器 MPUCR ( 地址 : 0xE 000 ED94) 


/ | / 
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攻 二 CL 0 
日 ENABIE RY 8 使 能 pu 

通过 把 PRIVDEFENA 置 位 ， 可 以 在 没有 建立 任何 region 残 使 能 MPU 的 情况 下 ， 依 然 允 许 特 权 级 程 
序 访 问 所 有 地 址 ， 而 具有 用 户 级 程序 被 拒 之 门 外 。 然 而 ， 如 果 设 置 了 其 它 的 region 并 且 使 能 了 MPU， 
则 背景 region 与 这 些 region 重 合 的 部 分 , 就 要 受 各 region 的 限制 。 为 了 方便 理解 , 让 我 们 作 一 个 对 比 ， 
看 看 PRIVDEFENA 在 置 位 与 清 零 时 ， 系 统 对 访问 的 限制 有 何不 同 ， 如 图 14.1 所 示 。 


PRIVDEFENA=0 PRIVDEFENA=1 


禁止 访 | 4GB 
ee 只 允许 特权 级 
下 的 代码 访问 
region -1 


适用 region 3 
的 规则 ， 覆 芋 了 





4GB 





region 2 的 
适用 region 2 | 适用 region 2 
的 规则 的 规则 
适用 region 1 适用 region 1 
的 规则 的 规则 


禁止 访问 Featon di 只 人 允许 特权 级 
下 的 代码 访问 
‘ * 0 \ . 
region 0 ee region 0 | ” 





图 14.1 ”PRIVDEFENA 的 影响 

要 注意 ， 只 要 没有 极 夯 类 的 考 夸 ， 了 惑 要 到 万 事 殉 绪 后 ， 最 后 一 步 才 置 位 ENABLE 位 。 合 则 ， 束 有 
可 能 因 region 没 有 配置 好 而 意外 地 产生 MemManage fault。 很 多 条 件 下 ， 为 安全 起 见 ， 最 好 在 执行 配 
置 MPU 的 子 程 前 先 除 能 MPU， 待 执行 后 再 重新 使 能 MPU。 
注意 : 这 里 有 个 例外 : 不 管 MPU 如 何 限 制 ， 了 响应 异常 时 的 取向 量 操 作 ， 以 及 对 系统 分 区 (system 
partition) 的 访问 总 是 不 受 影响 的 。 
详 注 : 这 里 所 说 的 “系统 分 区 ”， 作 者 并 没有 解释 过 。 估 计 有 可 能 是 包含 在 前 面 提 到 的 “SCS” 区 
When the MPU 1s enabled, only the System partition and vector table loads are always 
accessible. 

配置 任何 一 个 region 之 前 ， 痢 需要 在 MPU 内 选中 这 个 region， 这 可 以 通过 把 region 写 写 入 MPU 
region 守 寄存 右 (MPURNR) 来 完成 ， 其 定义 如 表 14.3 所 示 
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表 14.3 MPU region 号 寄 仔 器 MPURNR (地址 : 0xE000_ED98 ) 


位 段 名 称 类 型 ”复位 值 ”描述 
7:6 REGION RW - 选择 下 一 个 要 配置 的 region。 因 为 只 支持 8 个 
reegion, 所 以 于 站 内 和 有 有 [2:6] 采访 义 
选 好 了 region 后 ， 束 可 以 在 另外 两 个 寄存 正中 配置 该 region 的 所 有 属性 了 。 
为 了 能 快速 地 配置 多 个 regions， 还 有 另 一 种 快捷 方式 。 在 MPU region 基 地 址 寄存 器 (MPURBAR) 
中 有 两 个 位 段 : VALID 和 REGION， 它 们 配合 使 用 可 以 绕 过 MPURNR。MPURBAR 的 定义 如 表 14.4 所 未 


表 14.4 MPU region 基 址 寄存 器 MPURBAR ” (地 址 : 0xE 000_ED9C) 





VALID 决定 是 否 理会 写 入 REGION 字 段 的 值 
1=MPU region 写 寄存 器 被 REGION 簇 六 
0=MPU region 号 寄存 器 的 值 保持 不 变 


从 表 中 我 们 可 以 看 出 ， 基 址 必须 对 齐 到 region 容 量 的 边界 。 举 例 来 说 ， 如 果 你 定义 的 region 容 量 
是 64KB， 那 么 它 的 基 址 就 必须 能 被 64KB 整 除 。 这 里 ， 像 0x0001,0000; 0x0002,0000 这 样 的 ， 就 是 合 


法 的 基 址 〈 低 16 位 为 0) 。 
如 果 读 取 REGION 位 段 ， 返 回 的 总 是 当前 的 region 号 ， 并 且 VALID 总 返回 0。 通 过 设置 VALID=1 和 





REGION=n， 也 可 以 改变 一 个 region 的 编号 。 相 比 于 先 设 置 MPU region 号 寄存 器 再 设置 本 寄存 器 的 正 
统 做 法 而 言 ， 这 是 一 个 快捷 方式 。 
注意 : 必须 以 字 的 方式 来 访问 本 寄存 器 ， 否 则 结果 不 可 预知 。 





= 


配置 好 了 基地 址 ， 我 们 还 需要 详细 定义 region 的 其 它 方 方面 面 。 这 需要 设置 MPU 属 性 及 容量 寄 
存 器 。 这 个 寄存 器 是 全 体 可 读 可 写 的 ， 且 复位 值 未 知 ， 如 下 表 14.5 所 示 : 
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表 14.5 MPU region 属 性 及 容量 寄存 器 MPURASR ( 地 址 : 0xE000_EDAO ) 
位 段 长 | 名称 功能 






































度 

31:29°3 I 保留 

28 1 | XN [= 此 区 符 下 取 指 
2 

2 ml 保留 

26:24 |3 | AP wl A ea 
值 特权 级 下 的 许可 | 用 户 级 下 的 许可 | 典型 用 法 
0b000 禁地 人 该 区 没有 人 存储器， 是 空地 址 
0b001 | RW 禁地 OS 以 及 系统 软件 使 用 的 数据 区 
0b010 | RW RO 禁止 在 用 户 级 下 更 改 的 蜗 危 地 种 
0b011 | RW RW 共享 内 存 ， 或 彻底 开放 的 设备 
0b100 n/a n/a n/a 
0b101 | RO 禁地 os 使 用 的 第 量 数据 
0b110 | RO RO 第 量 数据 或 只 讯 存储 右 的 地 址 区 
0b111 | RO RO 种 量 数据 或 只 读 存 储 器 的 地 址 区 

D300 保留 

ZT 类 型 扩展 

18 1 S Shatable (可 否 共 享 ) 
1= 共 享 可 
0 不 可 

16 1 B Buffable (可 和 否 缓 冲 ) 
1= 缓 冲 可 
0= 缓 冲 不 可 

15:8 |8 | SRD 子 region 除 能 位 段 。 每 设置 SRD 的 一 个 位 ， 束 会 除 能 与 之 对 应 的 一 个 子 region。 
容量 大 于 128 字 市 的 region 都 被 划分 成 8 个 容量 相同 的 子 region。 容 量 小 于 等 于 
128 学 广 的 region 不 能 再 分 。 更 多 信息 ， 请 参见 对 子 Region 的 论述 。 

6 2 | 保留 

5:1 5 | REGIONSIZE Region 容 量 ， 单 位 是 字 节 。 容 量 为 1<< (REGIONSIZE+1)， 但 是 最 小 容量 为 32 字 节 

0 1 SZENABLE Wn 0= 除 能 此 region 





表 中 提 到 了 “ 子 region” 的 概念 〈[15:8] ) 。 原 来 ，8 个 region 的 定义 过 于 粗 校 大 时 ， 因 而 允许 再 
精 雕 细 琢 ， 把 每 个 region 和 的 内 部 进一步 划分 成 更 小 的 块 ， 这 就 是 子 region。 但 是 子 region 的 使 用 有 限 
制 : 每 个 region 必 须 8 等 分 ， 每 份 是 一 个 子 region， 而 且 所 有 子 region 的 属性 都 与 “ 父 region” 的 是 相 
同 的 。 每 个 子 region 可 以 独立 地 使 能 或 除 能 〈 相 当 于 可 以 部 分 地 使 能 一 个 region ) : SRD 中 的 8 个 位 ， 
每 个 位 控制 一 个 子 region 是 否 被 除 能 。 如 SRD.3=0， 则 3 号 子 region 被 除 能 。 如 果 某 个 子 region 被 除 能 ， 
且 其 对 应 的 地 址 范围 又 没有 落 在 其 它 region 中 ， 则 对 该 子 region 履 兽 范 围 的 访问 将 引发 fault。 最 后 ， 
能 被 “大 锰 八 块 ” 的 region, 最 小 也 要 有 256 字 节 。 如 末 是 对 128 字 攻 或 者 是 更 小 的 region 划 分 子 region， 
则 后 果 是 不 可 预料 的 。 
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再 看 它 的 AP 位 段 ， 为 了 详细 说 明 把 它 做 成 了 一 个 表 中 表 。AP 位 段 用 于 限定 各 种 访问 权限 ， 这 也 
是 加 以 分 区 保护 的 最 重要 组 成 部 分 。 

位 段 [28] 的 名 字 是 XN (eXecute Never), 它 决 定 在 本 region 中 是 人 否 允 许 取 指 。 如 采 不 允许 取 指 ( 清 
零 ) ， 则 任何 指令 预 取 都 将 触发 MemManage fault。 这 有 什么 用 ? 通常 ， 可 以 把 新 得 到 的 还 不 受信 
任 的 代码 先 存储 到 此 区 ， 待 经 过 身份 鉴定 后 ， 再 允许 它 执行 。 

表 中 楷体 的 TEX, 5, B 和 C《〈 整 体位 于 [21:16]) ， 对 应 着 存储 系统 中 比较 高 级 的 概念 。CM3 中 没有 
缓存 (cache)， 但 是 CM3 是 以 v7-M 的 架构 设计 的 ， 而 v7-M 支 持 外 部 缓存 (天 不 多 是 L2 绥 存 的 地 位 〉， 以 
及 更 先进 的 存储 右 系 统 。 按 v7-M 的 规格 说 明 ， 可 以 通过 对 这 些 位 段 的 编程 ， 来 文 持 多 样 的 内 存 管 理 
模型 。 从 v6 开 始 ，ARM 架 构 文 持 两 级 缓存 〈 与 Xx86 的 绥 存 系统 是 异曲同工 的 ) ， 分 别 是 : 内 部 缓存 和 
外 部 缓存 ， 它 们 可 以 有 不 同 的 缓存 方针 (policy)， 这 些 位 组 合 的 详细 功能 如 下 表 所 示 : 











表 14.6 TEX,C,B 对 存储 器 类 型 的 决定 


TEX CB 撕 术 《存储 器 类 型 可 否 共享 


000 1 工 片 外 或 片 内 的 * 写 回 “型 内 存 ， 没 有 写 allocate 








表 中 最 后 一 项 越发 离奇 ， 它 是 TEX 的 MSB=1 时 的 情况 。 此 时 ， 如 果 该 region 是 片 内 存储 器 ， 则 由 C 和 B 
决定 其 缓存 属性 (AA〉; 如 果 是 片 外 存储 器 ， 则 由 TEX 的 [1:0] 决 定 其 缓存 属性 (BB)〉。 不 管 是 AA 还 
是 BB， 每 个 数值 的 含义 都 是 相同 的 ， 如 下 表 所 示 : 


表 14.7 ”缓存 万 针 编 码 


存储 器 属性 编码 (AA and BB) 高 速 缓存 策略 








0 写 回 , 读 写 均 有 alocate 
1 alocate 


欲 知 绥 存 行为 和 缓存 方 针 的 更 多 详情 ， 请 参阅 《ARM Architecture Application Level Reference 








Manual(Ref2)》 。 

再 看 本 章 开头 的 寄存 右 表 ， 最 后 的 8 个 其 实 是 4 对 ， 且 后 3 对 都 第 1 对 的 别名 ， 这 可 真是 “狼人 倪 二 
宣 ” 啊 。 再 仔细 看 ， 你 会 发 现 它们 的 地 址 是 连续 的 。 这 下 是 不 是 有 看 出 一 些 端倪 了 ? 请 看 下 段 详 日 
Cortex-M3 TRM 的 解释 : 
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9.2.3 使 用 别名 (alias) 寄 存 嚣 访问 MPU 

通过 寄存 器 别名 机 制 , 你 可 以 使 用 STM 指 令 加 速 对 regions 的 初始 化 一 一 一 次 可 以 最 多 人 初 
始 化 4 个 。 一 共有 3 组 别名 寄存 器 。 别 名 以 完全 相同 的 方式 来 访问 《真实 的 ) 寄存 占 ， 它 们 的 
存在 是 为 了 让 你 能 以 “顺序 号”(STM 指 令 ) 来 一 次 更 新 1-4 个 region。 当 无 需 在 采 些 “临界 ” 
区 域 中 以 “ 除 能 region/ 更 改 region 属 性 /使 能 retgion” 的 小 心 方式 ， 来 一 个 个 地 进行 配置 时 ， 
这 个 机 制 束 显得 特别 有 用 。 

下 面 举 一 个 一 次 更 改 4 个 region 的 代码 例子 : 
8 0 Tet enydT (0 7 
MOV RO, #NVIC_BASE 

















ADD RO, #MPU_ REG_CTRL 
LDM R1， [R2-R9] ; 加 载 4 个 region 的 信息 
STM R0， [R2-R9] ;一句 话 完 成 4 个 region 的 配置 

这 人 么 一 来 ， 只 要 事先 做 好 一 个 配置 表格 ， 就 可 以 一 气 呵 成 了 。 

你 不 能 使 用 这 些 别 名 来 谈 取 regions 的 内 容 ， 因 为 必须 要 先 写 region 号 。 

在 C/C++ 下 通常 使 用 memcpy() 函 数 来 完成 上 上 段 汇 编 的 功能 。 但是， 你 必须 验证 CRT 库 ， 在 
实现 memcpy() 时 必须 是 按 字 拷贝 的 一 一 也 就 是 两 个 long* 指针 之 间 的 拷贝 ， 而 不 得 是 char*， 
short* 什 么 的 。 

本 华 后 面 还 有 一 个 “一 感 多 解 ” 的 例子 ， 最 后 的 解法 就 是 使 用 这 里 讲 到 的 思路 








14.3 局 用 MPU 





MPU 寄 存 吉 看 起 来 比较 复杂 ， 那 是 目 然 了 ， 毕 竞 已 经 上 升 到 存储 器 管理 的 高 度 。 但 如 采 我 们 鹏 
有 成 竹 一 一 已 经 想 好 了 对 存储 融 如 何 划 分 ， 这 了 吏 只 是 一 些 崇 琐 和 考验 细心 的 体力 活 。 典 型 情况 下 ， 
在 局 用 MPU 的 系统 中 ， 都 会 有 下 列 的 regions。 

国 ”特权 级 的 程序 代码 (如 05 内 核 和 寞 常服 务 例 程 ) 

用 户 级 的 程序 代码 

特权 级 程序 的 数据 和 存储器， 位 于 代码 区 中 (data_stack) 

用 户 级 程序 的 数据 存储 器 ， 位 于 代码 区 中 (data_stack) 
通用 的 数据 存储 右 ， 位 于 其 它 存 储 右 区 域 中 (如 ，SRAM) 

系统 设备 区 ， 只 允许 特权 级 访问 ， 如 NVIC 和 MPU 的 寄存 器 所 有 的 地 址 区 间 
常规 外 设 区 ， 如 UART，ADC 等 。 

对 于 CM3 来 说 ， 绝 大 多 数 region 中 ， 都 有 TEX=0，C=1，B=1。 系 统 设备 〈 如 NVIC) 必须 “严格 顺 
序 ” (strongly ordered) 访问 ; 另 一 方面 ， 外 设 regions 则 可 以 共享 (TEX=0, C=0, B=1) 。 如 果 想 要 在 
某 个 region 中 ,确保 所 有 的 总 线 fault 都 是 精确 的 ， 束 必 须 把 该 region 严 格 顺 序 化 (TEX=0, C=0, B=0) 。 
这 样 一 来 写 缓冲 被 除 能 ， 但 也 因此 产生 性 能 损失 的 代价 。 

图 14.2 给 出 了 MPU 初 始 化 序列 的 流程 模式 图 。 在 使 能 MPU 前 ， 或 者 把 问 量 表 重 定位 到 了 RAM， 
一 定 不 要 护 记 为 MemManage fault 建 立 癌 量 , 并 且 在 NVIC 的 系统 handler 探 制 及 状态 寄存 器 SHCSR 中 使 
EMemManage fault。 只 有 这 样 做 了 ， 才 能 在 产生 MPU 违 例 时 ， 让 MemManage fault 服 务 例 程 得 以 执 























~ 


ml 
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检视 MPU 类 型 寄存 器 ,来 
获知 是 否 存在 MPU , 且 


region 数 量 是 否 够 用 


-egion 选 择 和 配置 
可 以 合并 在 一 起 








除 能 MPU 
选中 region 0 


写 入 基 址 和 配置 信息 





写 入 基 址 和 配置 信息 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 ” 


选中 region N 


写 入 基 址 和 配置 信息 





使 能 MPU 


图 14.2 


MPU 初 始 化 序列 


MPU 建 立 









错误 


下 面 举 一 个 简单 的 例子 ， 它 只 有 4 个 region， 则 配置 代码 如 下 所 汗 示 : 


LDR 
MOYV 
STR 
LDR 
STR 
LDR 
STR 
MOYV 
STR 


RO; 
R1, 
R1, 
R1, 
Rl 
R1, 
R1, 
Ry 
Rhy 


=0xEO000ED98 
#0 

[RO] 
=0x00000000 
[RO, #4] 
=0x0307002F 
[RO, #8] 

#1 

[RU 


; Region 与 寄存 器 


r 


选择 region 0 


基 址 = 0x00000000 
MPU Region 基 址 寄存 器 
RR/W: TEX=0,. 8=1.C=1; B=1, 








16MB, Enable=1 


MPU Region 属性 及 容量 寄存 器 


选择 region 1 


第 14 章 


209 


Cortex-M3 权威 指南 第 14 章 











LDR R1, =0x08000000 ; 基 址 = 0x08000000 

STR R1, [RO, #4] ; MPU Region 基 址 寄存 器 

LDR R1, =0x0307002B ; R/W, TEX=0,S=1,C=1,B=1, 4MB, Enable=1 
STR R1, [RO, #8] ; MPU Region 属性 及 容量 寄存 器 

MOV R1, #2 ; 选择 region 2 

STR R1, [RO] 

LDR R1, =0x40000000 ; 基 址 = 0x40000000 

STR = [RO, #4] ; MPU Region 基 址 寄存 器 

LDR R1, =0x03050039 ; R/W, TEX=0,S=1,C=0,B=1, 512MB, Enable=1 
STR R1, [RO, #8] ; MPU Region 属性 及 容量 寄存 器 

MOV R1, #3 ; 选择 region 3 

STR R1, [RO]J 

LDR R1, =0xE0000000 ; 基 址 = 0xE0000000 

STR R1, [RO, #4] ; MPU Region 基 址 寄存 器 

LDR R1, =0x03040027 > RN TEX=0.8=1,.0=0,8=0, IMB Tinable—1 
STR R1, [RO, #8] ; MPU Region 属性 及 容量 寄存 器 

MOV R1, #1 ; 准备 使 能 MPU 

STR [RO, #—4] ; 使 能 MPU (0xE000ED98-4=0xE000ED94) 


这 有 段 代 人 码 执 行 后 ， 生 成 如 下 的 4 个 regions: 
特权 级 代码 
将 权 权 数据 
eg 


全 访问 
系统 接 仙 笠 权 级 访问 严格 硕 序 ，X 


通过 使 用 基 址 寄存 器 的 VALID 和 REGION 位 段 , 可 以 把 region 选 择 和 基 址 设置 的 两 个 动作 合并 成 一 
个 ， 从 而 缩短 代码 ， 如 下 所 示 : 














LDR RO, =0xE000ED9C ; MPU redgion 基 址 寄存 器 

LDR R1, =0x00000010 ; 基 址 =0x00000000，region=0，valLid=1 

STR R1, [RO, #0] ; 设置 [region 0 的 基 址 

LDR R1, =0x0307002F > R/N: TEX=0,.8=1,.C=1 B=1, 16\/B. Enable=] 
STR R1, [RO, #4] ; MPU Region 属性 及 容量 寄存 器 

LDR R1, =0x08000011 ; 基 址 =0x08000000，region=1, valid=1 

STR [=u [RO, #0] ; MPU Region 基 址 寄存 器 

LDR R1, =0x0307002B ; R/W, TEX=0,S=1,C=1,B=1, 4MB, Enable=1 
STR R1, [RO, #4] ; MPU Region 属性 及 容量 寄存 器 

LDR R1, =0x40000012 ; 基 址 =0x40000000，，region=2, valid=1 

STR R1, [RO, #0] ; MPU Region 基 址 寄存 器 

LDR R1,， =0x03050039 ; R/W, TEX=0,S=1,C=0,B=1, 512MB, Enable=1 
STR R1, [RO, #4] ; MPU Region 属 性 及 容量 寄存 器 
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LDR R1, =0xEO0000013 : 
STR R1, [RO, #0] ; 
LDR R1, =0x03040027 - 
STR R1, [RO， #4] ; 
MOV R1, #1 ; 
STR R1, [RO, #-8] ; 
看 ， 代 码 变 短 了 吧 ! 不 过 ， 还 有 比 这 更 
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基 址 =0xE0000000， region=3，, valid=1 
MPU Region 基 址 寄存 器 
R/W, TEX=0,S=1,C=0,B=0, lMB, Enable=1 





MPU Region 属性 及 容量 寄存 右 


使 能 MPU 


; MPU 探 制 寄存 器 (0xE000ED9C-8=0xE000ED94) 


厉害 的 ， 让 代码 更 短 更 快 。 这 要 通过 使 用 MPU 别 名 寄存 


器 的 地 址 来 完成 。 在 MPU 属 性 及 容量 寄存 器 (MPUASR) 的 后 面 ， 有 3 组 MPU 基 址 寄存 器 (MPUBAR) 和 
MPU 属 性 及 容量 寄存 器 的 别名 ， 连 同 真 实 的 MPUBAR 与 MYPUASR， 它 们 共有 4 组 ， 分 布 在 一 个 连续 的 8 
字 室 间 中 ， 于 是 就 可 以 使 用 LDM/STM 指 令 来 “ 串 烧 ”， 如 下 所 示 : 











LDR RO, =0xEO0O0ED9C 
LDR R1, =MPUCconfigTab 
LDMIA R1!, {R2-—R9)} 
STMIA RO0!, {R2-—R9} 
B MPUconfigEnd 
ALIGN 4 
MPUconfigTab 
DCD Ox00000010 
DCD Ox0307002F 
DCD Ox08000011 
DCD Ox0307002B 
DCD Ox40000012 
DCD Ox0S050039 
DCD OxEO0000013 
DCD Ox03040027 
MPUconfigEnd 
LDR RO, =0xEO0OED94 
MOYV R1, 提 工 
STR R1, [RO] 


r 


r 


A 


r 


MPU reigon 基 址 寄存 器 
预定 义 的 MPU 初 始 化 数值 表 
一 气 从 表 中 读 完 8 个 字 

一 气 初始 化 4 个 region 








此 汇编 指示 字 可 以 确保 下 述 的 字 定义 一 定 是 对 齐 到 字 
边界 的 ， 因 为 在 使 用 LDM/sTM 时 ， 地 址 必须 按 字 对 齐 


基 址 =0x00000000， region=0,valid=1 

R/W, TEX=0,S=1,C=1,B=1, 1l16MB, Enable=1 
基 址 =0x08000000， region=0,valid=1 

R/W, TEX=0,S=1,C=1,B=1, 4MB, Enable=1 
基 址 =0x40000000， region=0,valid=1 

R/W, TEX=0,S=1,C=0,B=1, 512MB, Enable=1 
基 址 =0xE0000000， region=0, valid=1 

R/W, TEX=0,S=1,C=0,B=0, 1MB, Enable=1 


MPU 控制 寄存 器 
使 能 MPU 











耕 用 此 法 ， 显 然 必 须 保 证 : region 配 置 早已 安排 好 了 ， 盏 则 束 只 能 用 上 睾 的 更 通用 的 办 法 。 为 
了 使 软件 更 有 模块 化 ， 可 以 把 建立 region 的 工作 包装 到 一 个 子 程序 中 ， 不 妨 名 为 MpuRegionSetup。 











它 接受 相关 参数 (编写 ， 基 址 ， 容 量 / 属 性 ) ， 并 执行 建 讶 region 的 工作 。 主 程序 通过 呼叫 它 硅 干 次 
来 逐一 设置 好 每 个 region。 

上 面 的 小 凉菜 吃 了 三 次 ， 想 必 读 者 已 经 腻 了 吧 。 下 面 就 上 主 菜 ， 使 用 模块 化 的 思路 ， 代 码 如 下 
所 示 。 这 段 代 码 的 后 面部 分 还 精彩 地 演示 了 新 好 指令 BFI 和 UBFX 的 使 用 : 





MpuSetup 
PUSH {RO-R6, LR} 
LDR RO, =0xE0O0OED94 
MOV R1, #0 
STR R1, [RO]J 
LCN #0 Ss 
LDR RO, =0x00000000 





r 


r 


r 


r 


入 口 函 数 ， 它 内 部 呼叫 若干 子 程序 米 完 成 MPU 设 置 
MPU 控制 寄存 器 
配置 前 先 除 能 MPU 


Region 0: 基 址 = 0x00000000 
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MOYV R1, #0x0 

MOYV R2， #0xl17 

MOYV 民 3， #0x3 

MOYV R4, FU%? 

MOYV Ro, #0x0 

MOYV R6, #0xl 

BL MpuReglionSetup 

; —-—— Region #1 一 -一 

LDR RO, =0x08000000 

MOYV R11, tO] 

MOYV R2， #0xl15 

MOYV Rs #0x3 

MOYV R4, #0x7 

MOYV Ro, #0x0 

MOYV R6, #0xl 

BL MpuRegionSetup 

; --- Region #4-#7 除 能 --- 

MOYV RD， #4 

BL MpuRegionDisable 

MOYV RO, #5 

BL MpuRegionDisable 

MOYV RU， #6 

BL MpuRegionDisable 

MOYV RO, #7 

BL MpuRegionDisable 

LDR RO =0xEOO0O0ED94 

MOV R1, #1 

STR R1, [RO] 

POP {RO—R6, PPC} 
MpuRegionSetup 

; MPU region 设置 及 启用 子 程 

大 同 条 件 : 

RO = 基 址 

7 R1 = Region 号 


AP _ 量 


; R2 = 谷 坚 


; ”R3 = AP (访问 许可 ) 


R4 


= MemAttrib 


; R5 = 子 region 除 能 
2 R6 = {XN,Enable} 


PUSH {RO-R1, 
BIC RO, 
记 丰 二 RO, 
ORR RO, 
LDR R1, 
STR RO, 
AND RO, 
UBFX R1, 
BFI RO, 
BFI RO, 
BFI RO, 
BFI RO, 
BFI RO, 
LDR LL， 
让 家 RO, 
POP {RO-R1, 


工 R } 

RO, #0x1lF 
R1, #0O， #4 
RO, #0xl10 
=0XE000ED9C 
LR1] 

R6, #0x01 
R6, #1， 卸 L 
R1, #28，#] 
R2, #] ,#5 
R3, #24 ，#3 
R4, #16，#6 
R5, #8，,，#8 
=0XE000EDAO 
LR1] 

PC } 


({TEX[2:0]s 


Region 0: Region 扎 = 0 
Region 0: 容量 = 0x17 (16MB) 
Region 0: AP = 0x3 ( 全 访问 ) 
Region 0: MemAttrib = Ox7 
Region 0: 子 region 除 能 =0 
Region 0: {XN, Enable} = 0,1 
Region 1: 基 址 = 0x08000000 
Region 1: Region5 守 = 1 
Region 1: 容量 = 0x15 (4MB) 
Region 1: AP = 0x3 (全 访问 ) 
Region 1: MemAttrib = Ox7 
Region 1: 子 region 除 能 = 0 
Region 1: {XN, Enable} = 0,1 


以 相同 的 方法 建 六 region #2 和 region #3 


; MPU 控制 寄存 器 


; 使 能 MPU 
; 返回 


Cr B}) 





; 清 零 基 址 中 铁定 不 会 用 到 的 位 段 
; 把 region 号 插入 到 R0[3:0] 


置 位 VALID 位 


; 加 载 MPU Region 基 址 寄存 器 的 地 址 
; 填写 之 

; 斌 取 使 能 位 

; 读 取 XN 位 


把 XN 插入 到 RO [28] 


; 把 region 容 量 (R2 [4:0]) 插 入 到 RO[5:1] 中 

; 把 AP (R3[2:0]) 插 入 到 R0[26:24] 中 

; 把 memattrib(R4[5:0]) 插 入 到 RO0 [21:16] 中 
; 把 子 SRD (R5[7:0]) 插 入 到 RO0[15:8] 中 

; 加 载 MPU Region 属 性 及 容量 寄存 器 的 地 址 

; 填写 之 

; 返回 
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MpuRegionDisable 
; 该 子 程序 用 于 除 能 一 个 region 
; 入 口 条 件 : ”RO0 = 竺 除 能 的 region 号 





PUSH | 芒 二 证 廊 

AND RO, RO, #0xF ; region 写 只 取 低 4 位 

ORR RO, 0 #0x10 ”，; 设 营 VALID 人 人 

DD 食 R1, =0xE000ED9C ; 加 载 MPU Region 基 址 寄存 器 的 地 址 

STR RO， [R1] 并 与 之 

MOV RO, #0 

LDR R1, =0xE000EDAO ; 加 载 MPU Region 属性 及 容量 寄存 器 的 地 址 
STR RO, [R1] ; 把 它 归 零 ， 这 也 强 涵 了 除 能 的 命令 

POP {R1; BEC) ; 返回 


在 本 例 中 ， 我 们 还 添加 了 一 个 用 于 除 能 和 “复位 ”无 用 region 的 子 程序 。 当 你 不 知道 某 个 region 
是 否 被 用 过 时 ， 使 用 它 来 使 其 “ 归 零 ”是 最 安全 不 过 的 了 。 

注意 代码 中 位 段 操 作 的 几 行 ， 想 想 看 ， 如 果 用 普通 的 移 位 和 数据 传送 指令 ， 将 会 繁琐 成 什么 样 
子 ! 








14.4 MPU 的 典型 设置 





在 典型 的 情况 下 , 当 需 要 阻止 用 户 程 序 访问 特权 级 的 数据 和 代码 时 , 可 以 局 用 MPU。 在 设计 MPU 
regions 时 ， 需 要 考虑 到 下 列 的 regions: 
1.， 代码 region 
a) ”特权 极 代 人 码 ， 包 括 初 始 的 问 量 表 
b) 用户 级 代码 
2. SRAM region 
a) ”特权 级 数据 ， 包 括 主 堆栈 
b) ”用 户 级 数据 ， 包 括 进 程 堆栈 
c) ”特权 级 位 之 别名 区 
d) “用户 级 位 市 别名 区 
3. 外 设 
a) “特权 级 外 设 
b) “用户 级 外 该 
c) “特权 级 外 设 的 位 市 别名 区 
d) 用户 级 外 设 的 位 市 别名 区 
4. 系统 控制 空间 (NVIC 以 及 调试 组 件 ) 
a) ” 仪 允许 特权 级 访问 
看 ， 上 而 列 出 了 11 个 region， 己 经 超出 了 MPU 文 持 的 最 多 8 个 ， 这 可 如 何 是 好 ?不怕 ， 还 记得 有 
个 “背景 region” 吗 ?【( 息 了 的 话 快 去 看 图 14.1) 。 我 们 可 以 把 所 有 的 特权 级 regions 都 归 入 至 景 region 
中 (PRIVDEFENA=1)。 这 样 一 来 , 怠 只 需要 明确 定义 用 户 级 的 regions 一 一 才 5 个 。 剩 下 3 个 后 备 的 “ 模 ”， 
可 以 用 于 在 外 部 RAM 中 (如 果 有 的 话 ) 设置 额外 的 regions,， 也 可 以 用 于 保护 只 读数 据 ， 还 能 用 于 “ 没 
收 ” 一 部 分 的 RAM 等 ， 总 之 这 是 大 虾 们 绽放 智 意 光 芷 的 地 方 。 


14.4.1 使 用 子 region 除 能 的 示例 


在 上 面 的 分 析 中 ， 外 设 是 对 用 户 开 放 的。 但 是 如 末 误 用 东 个 外 设 可 能 导致 严重 后 果 的 话 ， 我 们 
怠 需 要 茶 止 用 户 级 程序 随意 访问 它 。 这 样 一 来 ， 了 吏 会 从 外 设 存储 融 空 间 中 割 下 几 块 肉 ， 使 一 个 完整 
的 空间 变 成 右 干 个 更 小 的 。 对 付 这 种 情况 ， 有 如 下 的 办 法 : 
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@ 定义 多 个 用 户 级 外 设 regions 

@ 在 用 户 级 外 设 region 中 重 半 地 定义 一 个 特权 级 的 region 

@ 在 用 户 级 外 设 region 中 启用 “ 子 region 除 能 机 市 ”。 

前 两 个 办 法 很 容易 耗 尽 宝贵 的 8 个 “region 模 ”。 蕊 片 在 设计 时 应 为 每 个 外 设 都 开 出 相同 容量 的 
外 设 空 间 ( 用 不 完 的 就 空 厦 ) ， 这 样 才能 让 开发 者 容易 使 用 第 3 种 方法 ， 即 除 能 子 region。 通 过 除 能 
子 region， 就 很 容易 地 从 用 户 级 region 中 擦 掉 一 部 分 ， 让 它 回 到 背景 region 中 了 。 一 个 例子 如 图 14.3 
所 示 




















SRD 位 自 时 

设备 7 ( 用 户 可 访问 ) 0 r 
© 

9 

设备 6 ( 特权 级 访问 ) 1 
© 

nn 


设备 5 ( 特权 级 访问 ) 


| 
[wn 





设备 4 ( 用 户 可 访问 ) 


尘 滁 池 
© 





设备 3 ( 用 户 可 访问 ) 


西峰 上 所 
© 





设备 2 ( 特权 级 访问 ) 


| 
| 





设备 1 ( 用 户 可 访问 ) 


| 
©O 





设备 0 ( 用 户 可 访问 ) 0 








在 用 户 级 外 设 region 中 
挖 出 3 个 子 region 
SRD=0b0110 0100 


图 14.3 ” “前景” 的 用 户 级 region 被 SRD 控 出 子 regions 


该 扩 马 也 可 以 用 在 普通 的 存储 豆 regions 中 ， 但 这 会 使 程序 更 加 复 杀 ， 所 以 最 好 不 要 玩 球 
沼 是 外 设 才 需 要 此 功能 。 在 使 用 时 ， 只 要 把 上 例 中 的 子 region 除 能 参数 改 为 非 0 即 可 ， 如 


MOV 5 #0x64 ; Region 1: 子 region 2，5， 6 被 除 能 














通 


WW 


最 后 ， 再 根据 上 一 个 例子 的 框 染 ， 举 一 个 可 能 在 实际 的 单片机 会 出 现 的 例子 : 


MpuSetup ; 入 口 函数 ， 它 内 部 呼叫 知 干 子 程序 来 完成 MPU 议 置 
PUSH {RO-R6, LR} 
LDR RO, =0xE000ED94 ; MPU 控制 寄存 右 
MOV R1, #0 
STR R1, [RO] ; 配置 前 先 除 能 MPU 
; —-—— Region #0 一 一 一 用 户 级 程序 
LDR RO, =0x00004000 ; Region 0: 基 址 = 0x00004000 
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MOV R1, #0x0 ; Region 0: Region 号 = 0 

MOV R2 ， #0x0D ; Region 0: 容量 = 0x0D (16KB) 
MOV ER #0x3 ; Region 0: AP = 0x3 ( 全 访问 ) 
MOV R4， #0x2 ; Region 0: TEX=0,S=0,C=1,B=0 
MOV R5, #0x0 ; Region 0: 子 region| 除 能 =0 
MOV R6, #0xl1 ; Region 0: {XN, Enable} = 0,1 
BL MpuRegionSetup 

; —-—— Region #1 -—-— 用 户 级 数据 

LDR RO, =0x20000000 ; Region 1: 基 址 = 0x20000000 
MOV R1, #0xl ; Region 1: Region 守 = 1 

MOV R2 ， #0x0B ; Region 1: 容量 = 0x0B (4KB) 
MOV R3, #0x3 ; Region 1: AP = 0x3 (全 访问 ) 
MOYV R4， #0xB ; Region 1: TEX=1,S=0,C=1,B=0 
MOV RS #0x0 ; Region 1: 子 region 除 能 = 0 
MOV R6, #0xl1 ; Region 1: {XN, Enable} =0,1 
BL MpuReglionSetup 

; --- Region #2 ——- 用 户 级 位 市 别名 区 

LDR RO, =0x22000000 ; Region 2: 其 址 = 0x22000000 
MOV R1, #0x2 ; Region 2: Region 写 = 2 

MOV R2 ， #0x10 ; Region 2: 容量 = 0x010 (128KB) 
MOV R3, #0x3 ; Region 2: AP = 0x3 (全 访问 ) 
MOV R4， #0xB ; Region 2: TEX=1,S=0,C=1,B=0 
MOV RB, #0x0 ; Region 2: 子 region 除 能 = 0 
MOV R6, #0xl1 ; Region 2: {XN, Enable} =0,1 
BL MpuReglionSetup 

; —-—- Region #3 一 一 一 用 户 级 外 设 

LDR RO, =0x40000000 ; Region 3: 其 址 = 0x40000000 
MOV R1, #0x3 ; Region 3: Region 号 = 3 

MOV R2 ， #0x13 ; Region 3: 容量 = 0x013 (1MB) 
MOV 民 3 #0x3 ; Region 3: AP = 0x3 (全 访问 ) 
MOV R4， #0xl1 ; Region 3: TEX=1,S=0,C=1,B=0 
MOV R5, #0x64 ; Region 3: 子 region 2,5,6| 除 能 
MOV R6, #0x3 ; Region 3: {XN, Enable} =1,1 
BL MpuReglionSetup 

; --- Region #4 ——- 用 户 级 外 设 的 位 市 别名 区 

LDR RO, =0x42000000 ; Region 4: 其 址 = 0x42000000 
MOV R1,， #0x4 ; Region 4: Region 写 = 4 

MOV R2 ， #0x18 ; Region 4: 容量 = 0x018 (32MB) 
MOV 度 3 #0x3 ; Region 4: AP = 0x3 (全 访问 ) 
MOV R4， #0xl1 ; Region 4: TEX=1,S=0,C=1,B=0 
MOV 下 号 > #0x64 ; Region 4: 子 region 2,5,6| 除 能 
MOV R6, #0x3 ; Region 4: {XN, Enable} =1,1 
BL MpuReglionSetup 

; -一 Region #5 一 一 一 外 部 RRAM 
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LDR RO, =0x60000000 
MOYV R11, #0x5 

MOV R2， #0x17 

MOYV Rs #0x3 

MOV R4， #0xB 

MOYV Ro, #0x0 

MOYV R6, #0xl 

BL MpuReglionSetup 
REGLON $406 未 使 用 ， 
MOYV RO, #6 

BL MpuRegionDisable 

; ——— Region #7 ——-— 

MOYV RO, #7 

BL MpuRegionDisable 


r 


Region 
Region 
Region 
Region 
Region 
Region 


Region 


把 它 归 零 


未 使 用 ， 把 它 归 零 


: 全 里 = 
: AP = 


OO OO mn OO JU JU 
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: 基 址 = 0x60000000 


Redion 写 = 5 
径 量 0x010 (16MB) 
0x3 (全 访问 ) 


TEX=0, S=0, C=1, B=1 


: 子 region 除 能 = 0 


{XN, Enable} =0,1 


(原文 中 ， 上 例 加 灰 的 指令 把 SRD 设 置 为 0x9B， 即 ~0x64， 看 起 来 似乎 是 SRD 的 某 个 位 为 零 时 才 除 能 对 应 的 子 region， 











与 图 14.3 中 给 出 的 三 进 制 数值 相反 。 在 详 者 合 阅 其 它 资 料 后 仍然 不 能 确定 时 ， 就 求助 于 ARM 了。 感谢 ARM 的 委 宁 先 





生 为 详 者 肯定 了 正确 的 答案 ! 





详 者 注 ) 。 





上 例 的 代码 执行 后 ， 建 并 的 regions 如 下 表 所 示 〔 假 设 单 片 机 有 32KB flash, 8KB RAM ) : 
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表 14.8 上 例 代码 执行 后 建立 的 各 regions 


地 址 范围 容量 | 类 型 oi MPU region 说 明 
C,B,A,S, 

0000 0000 至 ‖ 16KB ; A, —,— 背景 特权 级 程序 

0000 3FFF 


0000 4000 全 | 16KB Region #0 用 户 级 程序 
0000_7FFF 
2000 0000 至 | 4KB RW Co Region #1 用 户 级 数据 
2000_OFFF 


2000 1000 至 ‖ 4KB Oo. 背景 特权 级 数据 

2000 1FFF 

2202 re 128KB 区 背景 | 特权 级 数据 的 位 带 别 
2203 FFFF 名 区 











4000_0000 至 | 1MB -, XN | Region #3 用 户 级 外 设 

400F_FFFF 
0 站 
1 4005_FFFF :RW ;Region #3 中 被 除 ， 围 中 的 特权 级 外 设 ， 
\ ; ; \ 能 的 子 region 2 \ 
1 二 刘 证 
; 400B_FFFF ， ; RW ;Region #3 中 被 除 ， 围 中 的 特权 级 外 设 ， 
: ; 能 的 子 region 5 : 
C00 i 
!' A00D_FFFF ，! ! RW ,Region #3 中 被 除 ， 围 中 的 特权 级 外 设  ， 
: 


a Te 6 可 





1 4280 0000 至 1 4MB 1 特权 级  -，B,-，-，XN 1 背景 用人 别 ， 
BE EE ! RW ' Region #4 中 被 除 ! 名 区 地 址 范围 中 的 特 
el op LE 能 的 子 region 2 ， 权 级 外 设 
| 4340_0000 全 ! 4MB ! 特权 级 AN 背景 I 在 用 户 级 外 设 位 带 别 I 
laseren. 1 RW ' Region #4 中 被 除 ! 名 区 地 址 范围 中 的 特 
1 eA RE hE 能 的 子 region5 1 权 级 外 设 
; 4380 0000 至 ，4MB ;特权 级 ，-vBr-v-v*XN ,背景 ; 在 用 户 级 外 设 位 带 别 ， 
43BF_FFFF RW ; Region #4 中 被 除 ‘ 名 区 地 址 范围 中 的 特 


; 能 的 子 region 6 ; 权 级 外 设 


6000 0000 人 至 | 16MB Region #5 外 部 RAM 
60FF_FFFF 


E000_0000 人 到 特权 级 | 背景 NVIC, 调 试 组 件 ， 以 及 
EOOF FFFF 私有 外 设 总 线 
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调试 系统 染 构 


调试 特性 概览 
CoreSight 技术 概览 
调试 模式 

调试 事件 
Cortex-M3 中 的 断 点 
调试 时 访问 实 存 占 
内 核 的 其 它 调试 特性 


15.1 调试 特性 概 史 


一 直 以 来 ， 单 片 机 的 调试 不 是 很 突出 的 主题 ， 很 多 山寨 点 的 程序 在 开发 中 ， 甚 至 都 没有 调试 的 
概念 ， 而 上 只 是 把 生成 的 映像 直接 烧 入 片子 ， 再 根据 错误 症状 来 判断 问题 ， 然 后 修改 程序 重新 烧 ， 周 
而 复 始 ， 直 到 问题 解决 或 放弃 为 止 。 能 够 格 算得 上 调试 的 活动 ， 至 少 也 是 设置 断 点 、 观 察 寄 存 器 和 
内 存 、 监 视 变 量 等 。 使 用 仿真 头 和 JTAG (如 AVR)， 可 以 方便 地 实现 这 些 基本 的 调试 要 求 。 在 开发 
比较 大 的 应 用 程序 时 ， 强 劲 的 调试 手段 是 非常 重要 的 。 当 bug 复杂 到 无 法 分 析 时 ， 只 能 用 调试 来 妃 
踪 它 。 如 果 没 有 调试 手段 ， 人 简直 就 束手无策 。 

正 因 为 此 ， 在 CM3 中 ， 调 试 机 能 突然 在 一 夜 之 间 ， 束 从 丑 小 卜 变 成 了 白天 鹅 ， 得 到 了 登峰造极 
般 的 ， 令 人 非常 惊艳 的 强化 。CM3 提供 了 多 种 多 样 的 调试 模型 和 调试 组 件 ， 很 多 想到 的 和 没 想到 的 
调试 方式 这 里 都 有 ， 让 人 惊叹 “原来 调试 还 可 以 做 到 这 种 程度 ” 为 了 方便 进一步 学 习 ， 我 们 把 CM3 
丰满 的 调试 功能 分 为 两 类 ， 每 类 中 都 有 更 具体 的 调试 项 目 ， 如 下 所 列 : 
侵入 陈 调 试 ( 这 也 是 基本 的 调试 机 能 ) 

a) 停机 以 及 单 步 执行 程序 

b) 偶 件 断 点 

c) 肠 点 指令 CBKPT ) 

d) 数据 观察 点 ， 作 用 于 单一 地 址 、 一 个 范围 的 地 址 ， 以 及 数据 的 值 。 

e) 访问 寄存 器 的 值 ( 既 包括 读 ， 也 包括 写 ) 

f) 调试 监视 右 异 党 

g) 基于 ROM 的 调试 (闪存 地 址 重 载 (flash patching) ) 

非 侵 入 陈 调 试 ( 大 多 数 人 更 少 接触 到 的 ， 蜗 级 的 调试 机 能 ) 

h) 在 内 核 运行 的 时 候 访 问 存 储 器 

i) 指令 跟踪 ， 需 要 通过 可 选 的 骸 入 式 跟 踊 宏 单元 (ETM) 

j) ”数据 跟踪 

k) 软件 跟踪 (通过 ITM (指令 跟踪 单元 )) 

1) 性 能 速写 (profiling)( 通 过 数据 观察 点 以 及 跟踪 模块 ) 

可 见 ， 我 们 以 前 最 常用 的 调试 都 属于 侵入 式 调试 。 所 谓 “ 侵 入 式 ”， 主 要 是 强调 这 种 调试 会 打 
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破 程序 的 全 速 运行 。 非 侵入 陈 调试 则 是 锡 上 次 花 的 一 闫 ， 当 调试 大 型 软件 和 多 任务 环境 下 的 软件 系 
统 时 ， 非 侵入 式 调试 有 不 可 蕉 代 之 强大 功效 。 

在 CM3 处 理 带 的 内 部 ， 包含 了 一 系列 的 调试 组 件 。CM3 的 调试 系统 基于 ARM 杀手 打 千 且 吐 血 推 
存 的 “CoreSight (内 核 景 象 )” 调 试 染 构 。 该 染 构 十 一 个 专业 设计 的 体系 ， 它 允许 使 用 标准 的 方 双 
来 访问 调试 组 件 ， 收 集 跟 踊 信 息 ， 以 及 检测 调试 系统 的 配置 。 





15.2 CoreSight 技术 概 咏 





CoreSight 调试 架构 的 定义 简直 包罗 万 象 ， 包 括 调试 接口 协议 、 调 试 总 线 协 议 、 对 调试 组 件 的 
控制 、 安 全 特性 、 跟 踪 接 口 等 。 在 《CoreSsight Technology System Design Guide(Ref3)》 中 ， 
对 CoreSight 有 详细 的 讲述 ， 此 外 ， 在 Cortex-M3 TRM 中 也 开 出 了 若干 章 ， 专 门 叙 述 CM3 中 调试 
组 件 的 设计 。 但 是 这 些 内 容 通 癌 上 只 是 给 设计 调试 软件 的 人 看 的 ， 我 们 软 便 件 开 发 者 不 要 陷 得 太 深 。 
不 过 ， 懂 一 点 调试 系统 的 组 成 结构 和 基本 工作 原理 ， 还 是 很 有 助 于 让 我 们 善 加 利用 这 强大 无 比 的 调 
试 系统 ， 大 幅 加 速 程 序 的 开发 的 。 


15.2.1 处 理 器 的 调试 接口 


CM3 的 调试 系统 已 经 与 ARM7/ARM9 的 大 相 径 姓 了， 基于 新 好 CoreSight 架构 ， 它 从 头 到 脚 都 
是 新 的 。 以 前 的 ARM 处 理 器 都 提供 JTAG 接口 ， 通 过 它 来 控制 对 寄存 器 和 存储 器 的 访问 。 在 CM3 中 
全 变 了 一 一 对 处 理 器 上 总 线 逻 辑 的 控制 使 用 另外 的 总 线 接口 , 即 通 过 所 谓 的 “调试 访问 端口 (DAP) ”。 
DAP 与 AMBA 中 的 APB 很 相似 。 在 CM3 中 ， 把 JTAG 或 串 行 线 协议 都 转换 成 DAP 总 线 接口 协议 ， 再 
控制 DAP 来 执行 调试 动作 。 

CM3 内 部 的 调试 总 线 DAP 是 APB 的 近亲 ， 所 以 很 容易 在 它 上 面 挂 上 很 多 调试 组 件 ， 从 而 使 得 调 
试 系统 可 大 可 小 ， 伸 缩 性 极 强 。 此 外 ， 把 调试 接口 和 调试 硬件 分 开 ， 也 是 颇具 匠心 的 ; 芯片 中 实际 
使 用 的 调试 接口 类 型 变 得 透明 化 。 从 而 不 管 使 用 了 什么 样 的 调试 接口 ， 相 同 的 调试 任务 都 可 以 按照 
同一 个 万 式 机 条。 

在 CM3 处 理 器 内 核 中 ,实际 的 调试 功能 由 NVIC 和 若干 调试 组 件 来 协作 完成 ,调试 组 件 包括 FPB， 
DWT，ITM 等 。NVIC 中 有 一 些 寄存 器 ， 用 于 控制 内 核 鸭 调试 动作 ， 如 停机 、 单 步 ， 其 它 的 一 些 功 能 
块 则 控制 观察 点 、 断 点 ， 以 及 调试 消 县 的 输出 等 。 

就 目前 来 看 ，CM3 支持 两 种 调试 主机 接口 (debug host interface ) :第 一 个 是 广 为 使 用 的 
JTAG 接口 ， 另 一 个 则 是 新 的 “ 串 行 线 (Serial Wire，SW) 调 试 接口 ” 新 出 的 SW 接口 对 信和 号 线 的 
需求 只 有 两 条 。ARM 公司 还 提供 了 奋 干 种 调试 主机 接口 模块 〈( 称 为 “调试 接口 ”(DP))。DP 充当 处 
理 器 与 调试 器 的 中 介 : 它 的 一 端 连接 到 调试 器 上 ， 另 一 端 则 连接 到 CM3 的 DAP 接口 上 。 
























































选择 串 行 绕 的 理由 





CM3 主要 针对 低 成 本 的 单片机 市 场 。 单 片 机 往往 没有 很 富裕 的 管 脚 资 源 。 而 JTAG 
协议 需要 使 用 4 根 脚 ， 而 SW 则 只 需要 两 根 。 











15.2.2 DP 模块 ，AP 模块 和 DAP 


从 外 部 调试 器 到 CM3 调试 接口 的 连接 ， 需 要 多 级 互联 才能 完成 ， 如 图 15.1 所 示 。 

第 一 步 ， 是 通过 DP 接口 模块 (通常 是 SWJ-DP 或 SW-DP)， 先 把 外 部 信号 转换 成 一 个 通用 的 32 
位 调试 总 线 信和 与 (图 表 中 的 DAP 总 线 )。SWJ -DP 文 持 SW 与 JTAG 两 种 协议 , 而 SW-DP 则 只 支持 SW。 
另外 ， 在 CoreSight 产品 中 还 可 以 使 用 一 种 J]TAG-DP， 它 只 支持 JTAG 协议 。DAP 总 线 上 的 地 址 是 
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32 位 的 ， 其 中 高 8 位 用 于 选择 访问 哪 一 个 设备 ， 由 此 可 见 ， 最 多 可 以 在 DAP 总 线 上 面 挂 256 个 设 
备 在 CM3 处 理 器 的 内 部 ,只 用 掉 了 一 个 设备 的 地 址 ,还 剩 下 的 255 个 都 可 以 用 于 连接 访问 端口 CAP ) 
到 DAP 上 总线 上 。 








单 睛 机 内 部 


Cortex-M3 





15.1 高 度 主 机 到 Cortex-M3 的 连接 
在 把 数据 从 DAP 接口 传递 给 CM3 处 理 器 后 ， 下 一 步 就 连接 到 了 一 个 称 为 “AHB-AP” 的 AP 设备 
上 上， 它 相 当 于 一 个 总 线 酉 ， 用 于 把 DAP 总 线 的 命令 转换 为 AHB 总 线 上 的 数据 传送 ， 再 插入 到 CM3 
内 部 的 总 线 网 络 中 。 这 么 一 来 ，CM3 的 整个 寻 址 空间 就 都 在 覆盖 范围 之 内 了 ， 连 NVIC 中 的 调试 控 
制 寄 存 喜 组 也 包括 在 内 。 在 CoreSight 系列 产品 中 ，AP 设备 可 以 有 好 几 种 类 型 ， 包 括 APB-AP 和 
JTAG-AP。APB-AP 顾名思义 ， 是 用 于 产生 APB 总 线 数 据 传送 动作 的 ， 而 JTAG-AP 则 用 于 控制 传统 
的 、 基 于 JTAG 的 测试 接口 ， 例 如 ARM7 上 的 调试 接口 。 


15.2.3 跟 路 接口 
CoreSight 架构 的 男 一 个 部 分 用 于 跟踪 。 在 CM3 中 有 3 种 跟踪 源 : 


1. 指令 跟踪 : 由 ETM (嵌入 式 跟踪 宏 单元 ) 产生 




















2 数据 跟 蹊 : 由 DWT 产生 


3。 调试 消息 : 由 ITM 产生 ， 提 供 形 如 printf 的 消息 输入 ， 送 到 调试 器 的 GUI 中 


在 跟踪 过 程 中 , 由 先 把 跟 踩 源 产 生 的 数据 囊 成 数据 包 , 然后 把 数据 包 送 到 “高 级 跟踪 总 线 CATB)” 
上 进行 传送 。 在 CoreSight 的 架构 中 ， 如 果 某 SoC 含有 多 个 跟踪 源 ( 例 如， 多 核 系统 )， 则 需要 一 
种 人 硬件 水 平 的 ATB 归并 器 (merger)， 撕 ”ATB 数据 流 归 并 成 一 条 (在 CoreSight 架构 中 ， 这 种 
便 件 被 名 为 ATB funnel)。 归 并 后 的 数据 流 都 送 往 TPIU《〈 跟 踩 问 口 接口 单元 )，TPIU 再 把 数据 导 
出 到 片 外 的 跟踪 硬件 设备 。 在 数据 送 到 了 调试 主机 (PC) 后， 再 由 PC 端的 调试 软件 还 原 为 先前 的 
多 条 数据 流 。 

尽管 在 CM3 中 拥有 多 个 跟踪 源 ， 但 CM3 内 建 了 一 个 归并 便 件 ， 因 此 不 需要 再 谎 加 ATB funnel 
模块 了 。 跟踪 输出 接口 可 以 直接 连接 到 专 为 CM3 设计 的 TPIU 上 , 然后 束 可 以 供 PC 控制 的 外 部 硬件 
捕捉 仪 来 跟踪 数据 。 


15.2.4 CoreSight 的 性 质 
基于 CoreSight 的 调试 设计 有 很 多 优势: 
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@ 即使 在 处 理 需 运 行 时 ， 也 可 以 查看 存储 项 和 外 设 的 寄存 器 的 内 容 

@ 使 用 单一 调试 器 ， 吏 可 以 控制 多 核 系统 的 调试 接口 。 例 如 ， 如 果 使 用 JTAG， 则 只 需要 一 个 
TAP 控制 器 ， 不 管 避 斤 中 有 几 个 处 理 机 都 一 样 。 

@ 内 部 的 调试 接口 是 基于 单 总 线 的 方式 设计 的 ， 因 此 非常 有 弹性 ， 也 简化 了 为 已 厂 的 其 它 音 
分 设计 附加 的 测试 逻辑 。 

@ 它 使 得 多 条 “跟踪 数据 流 ” 可 以 由 单一 的 “ 跟 躁 捕获 设备 ”来 收集 ， 送 到 PC 机 上 之 后 再 
还 原 出 先前 的 各 条 数据 流 。 

CM3 中 的 调试 系统 是 基于 CoreSsight 的 ， 但 是 又 有 一 些 “ 变 异 ” 

@ CM3 的 跟踪 组 件 是 重新 设计 的 ,有些 在 CM3 中 的 ATB 接口 是 8 位 的 , 而 纯 种 的 CoreSight 
的 都 是 32 位 的 。 

@ CM3 的 调试 系统 没有 实现 TrustZzone 一 一 ARM 提供 的 一 种 技术 ， 用 于 在 人 藤 入 式 产品 中 提供 
安全 特性 。 

@ 调试 组 件 所 需 的 空间 挤 到 了 系统 的 存储 右 映 射 中 。 而 在 标准 的 CoreSight 系统 中 , 是 为 调 
试 总 线 另 开 了 一 个 地 址 空间 的 。 例如, 在 CoreSight 系统 中 , 系统 连接 的 概念 图 如 图 15 .2 


ra: 
TY 
#1 #2 #3 


DAP 总 线 
APB-AP 
i Debug APB 


AHB-AP Csaea ) 存储 器 | 
JTAG-AP 
JTAG 


15.2 CoreSight 系统 设计 概念 图 
而 在 CM3 中 ， 调 试 设备 共享 同一 个 同一 个 存储 右 映 射 ， 如 图 15.3 所 示 


cortex-M3 调 试 控制 系统 的 基本 连接 


至 调试 主机 的 接口 | swWJ-DP 或 DAP 总 线 AHB_AP en 






































至 调试 主机 的 接口 | swJ-DP 或 
JTAG 或 SW | SW-DP 








APB 


外 部 PPB 


| 
| 
2 





JTAG 或 SW SW-DP 











22 


Cortex-M3 权威 指南 第 15 章 


15.3 Cortex-M3 的 调试 系统 
尽管 CM3 的 调试 组 件 在 实现 上 与 标准 CoreSight 系统 的 有 些 出 入 ， 但 是 通信 接口 与 协议 是 与 
CoreSight 架构 兼容 的 ， 并 且 可 以 直接 挂 接 到 CoreSight 系统 上 ， 标 准 CoreSight 的 调试 组 件 也 
可 以 挂 接 到 CM3 上 。 例 如 , (标准 ) CoreSight 调试 组 件 ， 诸 如 TPIU， 调 试 别 口 以 及 跟踪 基础 设施 
等 ， 可 以 供 CM3 使 用 ， 并 有 旦 以 此 来 把 调试 能 力 延 伸 到 多 核 调试 系统 中 。 








关于 CoreSight 架构 的 更 多 内 容 ， 请 参阅 《CoreSight Technology System Design 
Guide(Ref3 ) 》。 


15.3 调试 模式 


在 CM3 中 的 调试 操作 模式 分 为 两 种 。 第 一 种 称 为 “halt”( 停 机 模式 )， 在 进入 此 模式 时 ， 处 理 
器 完全 停止 程序 的 执行 。 第 二 种 则 称 为 “debug monitor exception”( 调 试 监视 器 模式 )， 此 时 
处 理 器 执行 相应 的 调试 监视 器 异常 服务 例 程 ， 由 它 来 执行 调试 任务 ， 并 且 依 然 允许 更 高 优先 级 的 措 
常 抢占 它 。 调 试 监视 器 的 异常 号 为 2， 优先 级 可 编程 。 除 了 调试 事件 可 以 触发 异常 外 ， 手工 设置 其 
芒 起 位 也 可 以 触及 本 异常 。 
1. 停机 模式 

@ 指令 执行 被 集 止 

@ SysTick 定时 器 停止 

@ 文 持 单 步 操作 

@ 中断 可 以 在 这 期 间 巧 起 ， 并 且 可 以 在 单 步 执行 时 响应 。 也 可 以 担 蔽 它们 ， 使 得 单 步 时 不 受 

干扰 

2. 调试 监视 器 模式 

@ 处理 器 执行 调试 监视 器 异常 的 服务 例 程 (异常 号 : 12) 



































@ SysTick 定时 此 继续 运行 

@ 新 来 的 中 断 控 普通 执行 时 的 原则 来 抢占 

@ 执行 单 步 操作 

@ 存储 带 的 内 容 〈 如 堆栈 内 存 ) 会 在 调试 监视 右 的 啊 应 始末 得 到 更 新 ， 因 为 有 目 动 入 栈 和 出 
栈 的 动作 








之 所 以 加 入 调试 监视 器 模式 ， 是 考虑 到 了 在 某 些 电 子 系统 运行 的 过 程 中 ， 是 不 可 以 停机 的 。 例 
如 ， 对 于 汽车 引擎 控制 器 以 及 电机 控制 器 ， 就 必须 在 处 理 调试 动作 的 同时 让 处 理 器 继续 运行 下 去 ， 
这 样 才 能 保证 被 测试 的 设备 不 会 意外 损坏 (例如 ， 不 需要 在 调试 过 程 中 让 电机 停 转 一 一 译 者 注 )。 
有 了 调试 监视 器 ， 束 可 以 停止 并 调试 线程 级 的 应 用 程序 ， 也 可 以 调试 低 优先 级 的 中 断 服 务 例 程 。 在 
这 同时 ， 融 优先 级 的 中 断 和 措 党 能 够 啊 应 。 

如 果 要 进入 停机 模式 ， 需 要 把 NVIC 调试 停机 控制 及 状态 寄存 器 (DHCSR〉 的 C_DEBUGEN 位 置 
位 。 这 个 位 只 能 由 调试 占 来 设置 ， 没 有 调试 器 是 不 能 把 CM3 停机 的 。 在 C_DEBUGEN 和 置 位 后 ， 束 可 
以 设置 DHCSR.C_HALT 位 来 喊 停 处 理 器 。 此 C_HALT 位 可 以 由 软件 置 位 。 

DHCSR 的 位 段 定义 比较 特殊 读 时 是 一 种 定义 ， 写 时 又 是 另外 一 种 定义 。 对 于 写 操作 ， 必 须 先 
往 [31:16] 中 与 入 一 个 “访问 钥匙 ” 值 。 而 对 于 读 操 作 ， 则 无 此 钥匙 ， 并 且 恋 回来 的 高 半 字 包含 
状态 位 ， 如 表 15 .1 所 示 。 


























表 15.1 调试 停机 控制 及 状态 寄存 器 DHCSR (地 址 : O0xE000_EDFO ) 


位 段 | 名 称 
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31:15 


25 
24 
19 
18 
7 
16 
15:6 


OP NW BU 


KEY 


Ss RESET ST 


S RETIRE ST 


Ss LOCKUP 
Ss SLEEP 
Ss_ HALT 

Ss REGRDY 
保留 


C_SNAPSTALL 


保留 
C_MASKINTS 
C_STEP 
C_HALT 
C_DEBUGEN 


RW 
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调试 调 吕 本 攻 顷 在 体 何 写 哥 作 昌 把 区 和 位 让 与 大 
A65F， 否 则 忽略 写 操作 

内 核 已 经 或 即将 复位 ， 读 后 清 零 

TE el 必 居 全 着 把 司 站 首 雪 
1= 内 核 进 入 了 锁定 状态 

1= 内 核 睡眠 中 

1= 内 核 已 停机 

1= 寄 存 器 的 访问 已 经 完成 





打上 断 一 个 stalled 存储 器 访问 





调试 期 间 关 中 断 ， 只 有 在 停机 后 方 可 设置 

让 处 理 器 单 步 执行 ， 在 C_DEBUGEN=1 时 有 效 
喊 停 处 理 器 ， 在 C_DEBUGEN=1 时 有 效 

使 能 停机 模式 的 调试 








*x: DHCSR 中 的 控制 位 是 在 上 电 复 位 时 得 到 复位 的 。 系统 复位 (例如 , 往 NVIC 应 用 程序 中 断 及 复位 寄存 器 中 写 命令 ) 
不 会 影响 到 它们 
在 正常 情况 下 ， 只 有 调试 器 会 操作 DHCSR， 应 用 程序 不 要 乱 动 它 ， 以 免 使 调试 工具 出 现 问 题 。 
当 使 用 调试 监视 右 模 式 时 ， 由 为 一 个 NVIC 中 的 寄存 器 来 负责 控制 调试 活动 , 它 是 NVIC 调试 寞 
常 及 监视 器 控制 寄存 器 (DEMCR)， 其 定义 如 表 15.2 所 示 。 


表 15.2 调试 及 监视 器 控制 寄存 器 DEMCR 


位 段 
24 


23:20 


JW 





名 称 
TRCENA 


保留 
MON_REQ 


MON_STEP 
MON_PEND 
MON_EN 
保留 
VC_HARDERR 
VC_INTERR 
VC_BUSERR 
VC_STATERR 
VC_CHKERR 


VC_NOCPERR 
VC_MMERR 
保留 

















(地址 : O0xE000_EDFC ) 


类 型 ”复位 值 描述 


RW 


RW 


RW 
RW 
RW 


RW 
RW 
RW 
RW 
RW 


RW 
RW 


O* 


O* 
O* 
O* 
O* 
O* 


O* 
O* 


跟踪 系统 使 能 位 ,在 使 用 DWT,ETM,ITM 和 TPIU 
前 ， 必 须 先 设置 此 位 


1= 调 试 监视 器 异常 不 是 由 人 硬件 调试 事件 触发 ， 
而 是 由 软件 手工 县 起 的 

让 处 理 器 单 步 执行 ， 在 MON_EN=1 时 有 效 
悬 起 监视 器 异常 请 求 ， 内 核 将 在 优先 级 允许 时 响应 
使 能 调试 监视 器 异常 





发 生硬 fault 时 停机 调试 

指令 /异常 服务 错误 时 停机 调试 

发 生 总 线 fault 时 停机 调试 

发 生 用 法 fault 时 停机 调试 

发 生 用 法 fault 使 能 的 检查 错误 时 停机 调试 
(如 未 对 齐 ， 除 数 为 零 ) 

发 生 用 法 fault 之 无 处 理 需 错误 时 停机 调试 

发 生存 储 器 管理 fault 时 停机 调试 
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日 | VC_CORERESET | RW | @* | 发 生 内 核 复 位 时 停机 调试 


*; DEMCR 中 的 控制 位 古 在 上 电 复 位 时 得 到 复位 的 。 系统 复位 (例如, 往 NVIC 应 用 程序 中 断 及 复位 寄存 右 中 写 命令 ) 














不 会 影响 到 它们 


该 寄存 器 不 仅 包含 了 调试 监视 器 的 控制 位 ， 还 包含 了 跟踪 系统 的 使 能 位 CTRCENA) 以 及 若干 向 














内 核 复位 ) 发 生 了 了 ， 并 且 对 应 的 VC 位 置 位 ， 则 将 目 行 产生 一 个 停机 请 求 ， 并 且 在 执行 完 当 前 指令 
后 立即 把 处 理 器 喊 停 。 

虽然 TRCENA 和 VC 控制 相关 的 位 只 有 上 电 时 才 复 位 , 但 是 其 它 用 于 控制 监视 鼎 模 式 的 位 ， 则 也 
会 因 系 统 复 位 而 复位 。 


15.4 调试 事件 


CM3 可 以 由 很 多 种 理由 进入 调试 模式 (both 停机 模式 和 调试 监视 余 模 式 )。 对 于 俘 机 模式 ， 满 
足 图 15.4 所 示 的 条 件 可 以 喊 停 处 理 磺 。 但 即使 是 俘 机 后 ， 也 可 由 上 电 复 位 和 系统 复位 来 复位 处 理 


ps 
手工 置 位 C_HALT 


DWT 的 数据 观察 点 匹配 




















HALT 


C_ DEBUGEN=1 









FPB 的 指令 断 点 匹配 
C DEBUGEN=0 
向 量 抓 捕 事件 
事 
件 时 





外 部 调试 请 求 


15.4 停机 模式 下 对 调试 事件 的 响应 


调试 监视 器 异常 






C DEBUGEN=1 








调试 监视 器 使 能 
C_ DEBUGEN=0 
调试 监视 器 除 能 


三 fault 
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图 中 ， 外 部 调试 请 求 信 号 是 通过 CM3 上 的 一 个 称 为 “EDBGREQ” 的 信号 线 传 来 的 ， 该 信号 线 的 
实际 连接 方式 取决 于 单片机 /Soc 的 设计 。 在 有 些 场合 下 可 以 把 该 信号 人 硬 线 连 至 低 电 平 ， 从 而 使 外 部 
调试 请 求 永远 无 法 送 达 ; 也 可 以 把 它 连接 到 附加 的 调试 组 件 上 ( 蕊 片 三 商 可 以 添加 额外 的 调试 组 件 ); 
或 者 在 多 核 系统 中 ， 可 以 用 来 连接 其 它 处 理 机 的 调试 事件 。 

在 调试 活动 完成 后 ， 通 过 清除 C_HALT 位 ， 可 以 让 程序 继续 执行 

类 似 地 , 在 调试 监视 器 模式 下 , 也 可 以 由 一 系列 的 调试 事件 来 进入 调试 模式 ， 如 图 15 .5 所 示 。 

从 图 中 可 见 ， 在 调试 监视 占 模 式 下 ， 与 在 停机 模式 下 的 动作 方式 还 是 有 一 点 区 别 的 。 这 是 因为 
调试 监视 器 寞 和 仅仅 是 寞 种 的 一 种 ， 它 可 以 影响 当前 的 优先 级 ， 但 是 不 能 使 处 理 器 停 下 来 。 

在 调试 活动 完成 后 ， 通 过 该 异常 的 返回 ， 即 可 回 到 正常 的 程序 执行 中 。 
































MON EN=1， 且 调试 监视 器 县 起 调试 监视 器 异常 


异常 的 优先 级 比 当 前 的 高 






Gr 
DWT 的 数据 观察 点 匹配 
调 
件 MON_EN=0 ,或 洞 试 监视 器 
外 部 调试 请 求 异常 的 优先 级 不 比 当前 的 高 
MON_EN=0 ,或 调试 监 


忽略 
异常 的 优先 级 不 比 当 a 


15.5 调试 监视 器 模式 下 对 调试 事件 的 响应 


MON_EN=1， 且 调试 监视 器 
异常 的 优先 级 比 当前 的 高 






响应 调试 监视 器 异常 


MON_EN=1， 且 调试 监视 器 
异常 的 优先 级 比 当前 的 高 


Fault 异 党 


15.5 Cortex-M3 中 的 断 点 


在 大 多 数 单 片 机 中 ， 用 得 最 多 的 可 能 束 是 断 点 了 。 在 CM3 中 ， 有 两 种 断 点 机 制 |: 

@ 新 点 指令 

@ 基于 FPB 地 址 比较 器 的 断 点 

汤 点 指令 的 格式 为 BKPT #im8， 它 是 一 个 16 位 的 Thumb 指 令 ， 编 码 为 8xBExx 一 一 其 低 8 位 就 是 
指令 中 #im8 的 值 。 当 该 指令 执行 时 ， 会 产生 一 个 调试 事件 。 当 C_DBGEN 置 位 时 可 以 用 于 喊 停 处 理 需 
内 核 ， 或 者 当 调 试 监视 器 使 能 时 ， 触 发 调试 监视 器 异常 。 对 于 后 者 ， 因 为 调试 监视 器 异常 也 是 一 种 
优先 级 可 编程 的 普通 异常 ， 所 以 也 可 以 因为 其 优先 级 不 够 高 而 不 能 立即 响应 。 可 见 ， 因 为 NMI 和 便 
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fault 的 优先 级 总 是 比 它 的 高 ， 所 以 不 能 在 它们 的 服务 例 程 中 使 用 BKPT 指 令 来 启动 调试 一 一 只 有 在 
它们 返回 时 才能 响应 调试 监视 器 异常 。 

使 用 BKPT 时 男 一 个 要 注意 的 是 ， 当 调试 监视 右 寞 常 运 回 后 ， 它 返回 到 的 是 BKPT 指 令 的 地 址 ， 而 
不 是 返回 BKPT 后 和 耐 一 条 指令 的 地 址 。 这 与 第 规 的 异 第 返回 是 不 同 的 ， 原 因 在 于 ， 在 正常 情况 下 使 用 
BKPT 指 令 时 ,BKPT 用 于 取代 一 条 正常 的 指令 , 并 且 当 命中 了 该 断 点 而 执行 了 调试 动作 后 ,把 该 BKPT 
指令 所 占用 的 内 存 恢复 为 先前 被 BKPT 取 代 的 指令 ， 并 且 让 该 指令 是 下 一 条 即将 执行 的 指令 ， 而 其 它 
的 部 分 不 受 影响 (这 其 实 也 是 软件 断 点 的 实现 方式 )。 

如 果 在 BKPT 指 令 执 行 时 却 发 现 C_DEBUGEN 和 MON EN 都 为 6， 则 会 因为 无 法 进入 调试 而 上 访 成 硬 
fault， 并 且 把 硬 fault 状 态 寄存 器 (HFSR) 的 DEBUGEVT 位 给 置 1， 同 时 在 调试 fault 状 态 寄 存 器 
CDFSR) 中 的 BKPT 位 也 置 1。 

如 果 程 序 存储 器 的 值 不 能 更 改 ， 则 可 以 通过 编程 FPB 来 产生 人 硬件 断 点 。 但 是 ， 只 支持 6 个 指令 地 
址 和 两 个 文字 地 址 。 下 一 章 将 展开 叙述 FPB。 

使 用 BKPT 指 令 取代 正和 尝 指 令 ， 以 及 对 FPB 的 编程 ， 通 党 都 是 在 我 们 设置 断 点 时 ， 由 调试 句 负 责 
做 的 事 。 


15.6 调研 时 访问 寄存 器 


在 NVIC 中 ， 还 有 两 个 寄存 器 与 与 调试 功能 有 关 。 它 们 分 别 是 : 调试 内 核 寄 存 器 选择 者 寄存 器 
(DCRSR)， 以 及 调试 内 核 寄 存 器 数据 寄存 器 (DCRDR)， 如 表 15.3 和 表 15 .4 所 示 。 调 试 器 需要 通过 
这 册 个 寄存 占 来 访问 处 理 占 的 寄存 器, 并 且 只 有 在 处 理 豆 停机 时 , 才能 使 用 这 里 的 寄存 上 右 传 送 功能 。 














表 15.3 调试 内 核 寄 存 器 选择 者 寄存 器 DCRSR ( 地 址 : 0xE 0 00_EDF4 ) 


as | | 





表 15.4 调试 内 核 寄 存 器 数据 寄存 器 DCRDR ( 地 址 : 0xE 0 00_EDF8) 


31:8 DATA RN |- 访问 来 的 寄存 器 的 值 ， 或 欲 写 入 寄存 器 的 值 ， 寄 
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| | 


欲 使 用 这 两 个 寄存 做 来 恋 取 内 核 的 寄存 硕 的 内 容 ， 则 必须 按 如 下 的 顺序 做 : 


1 
2 
3 
4 





.确定 处 理 器 已 停机 
， 往 DCRSR 写 数据 ， 其 中 位 16 要 为 6， 表示 这 是 要 读数 据 





查询 ， 直 到 DHCSR.S_REGRDY=1 
， 读 取 DCRDR 以 获取 寄存 器 的 内 容 











寄存 器 写 操作 的 顺序 与 上 面 的 类 似 : 
1. 确定 处 理 器 已 停机 


之 
3 


往 DCRDR 中 写 数据 
往 DCRSR 写 数据 ， 其 中 位 16 要 为 1， 表 示 这 是 要 写 数 据 





4. 查询 ， 直 到 DHCSR.S_REGRDY=1 
使 用 DCRSR 和 DCRDR 来 访问 寄存 器 ， 只 适用 于 停机 模式 。 如 果 选 择 了 调试 监视 器 模式 ， 则 对 于 目 动 
入 栈 的 寄存 器 ， 可 以 从 堆栈 中 该 写 它 们 ;， 对 于 其 它 寄 存 器 ， 怠 可 以 直接 在 服务 例 程 中 访问 。 

如 果 有 合适 的 函数 库 和 调试 器 的 文 持 , 还 可 以 使 用 DCRDR 来 做 半 主 机 (semihosting)。 比 如 说 ， 
当 应 用 程序 执行 了 printf 语 句 时 , 文学 的 输出 可 以 通过 一 系列 的 putc() 调 用 来 完成 ,在 实现 putc() 

















时 ， 可 以 让 它 把 输出 的 字符 和 状态 写 到 DCRDR 中 ， 然 后 触发 调试 模式 。 接 下 来 ， 调 试 套 可 以 检 训 到 
内 核 俘 机 状态 ， 并 且 读 取 和 被 输出 的 字符 。 然 而 ， 这 种 形式 的 半 主 机 需要 喊 保 内 核 。 更 正点 的 半 主 机 
是 使 用 ITM， 它 则 没有 此 限制 。 


15.7 内 核 的 其 它 硼 试 特性 


在 NVIC 中 ， 还 有 其 它 一 些 与 调试 有 关 的 特性 ， 它 们 包括 : 











外 部 调试 请 求 信 号 : NVIC 提 供 了 一 个 外 部 调试 请 求 信号 ， 通过 它 可 以 让 CM3 处 理 器 由 外 部 
调试 事件 触发 而 进入 调试 模式 。 举 一 个 外 部 调试 事件 的 例子 : 在 多 核 系 统 中 ， 可 以 是 其 它 
处 理 机 的 调试 状态 ， 这 对 于 调试 多 核 系 统 的 意义 决 非 等 亲 。 如 果 是 单 核 的 单片机 ， 则 基本 
上 是 把 该 信号 拉 低 。 

调试 fault 状 态 寄 存 器 : 因为 在 CM3 上 有 多 种 调试 事件 ， 故 而 设置 了 一 个 DFSR， 以 资 调试 
器 来 判断 是 发 生 了 哪 种 调试 事件 。 

复位 控制 : 在 调试 期 间 ， 可 以 使 用 VECTRESET 控 制 位 来 重启 处 理 器 内 核 (位 于 NVIC 应 用 程 
序 中 断 及 复位 控制 寄存 器 中 (地 址 : 6xE6868 ED8C))。 通 过 使 用 这 种 方式 ， 可 以 不 让 处 理 
器 的 复位 波及 到 调试 系统 。 

中 断 撞 毅 : 在 单 步 时 这 个 功能 是 非常 体贴 的 。 因 为 在 单 步 时 ， 往 往 是 为 了 集中 精力 分 析 某 
段 代码 的 逻辑 ， 此 时 不 希望 受到 任何 骚扰 ， 哪 怕 是 啊 应 中 断 也 是 很 讨 人 厌 的 事 。 通 过 置 位 
C_MASKINTS 位 《在 调试 俘 机 控制 及 状态 寄存 器 中 ，( 地 址 : 8xE888_EDF8))， 束 可 以 在 单 
步 期 间 掩 珊 中 晰 。 

终止 stalled 总 线 传送 : 如 果 一 个 总 线 传 送 被 stal1 了 一 个 很 长 的 时 间 ， 惑 可 以 强制 终结 
它 。 在 调试 停机 及 状态 寄存 器 中 有 一 个 C_SNAPSTALL 位 ， 把 它 置 位 即 可 。 但 是 这 个 功能 只 
有 在 俘 机 模式 下 才能 由 调试 器 使 用 。 
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调试 组 件 


人 简介 

跟踪 组 件 : 数据 观察 点 与 跟踪 (DWT) 
跟踪 组 件 : 仪器 化 跟踪 宏 单 元 (ITM) 
跟踪 组 件 : 磐 入 式 跟 踩 宏 单元 (ETM) 
跟 踊 组件， 跟踪 端口 接口 单元 (TPIU) 
内 存 地 址 重 载 与 断 点 单元 (FPB) 

AHB 访问 端口 

ROM 表 





16.1 从 介 


在 CM3 的 大 礼包 中 有 很 多 调试 组 件 ， 使 用 它们 可 以 执行 各 种 调试 功能 : 断 点 、 数 据 观 察 点 、 闪 
存 地 址 重 载 以 及 各 种 跟 踩 等 .如 采 您 是 一 位 软件 开发 人 员 , 则 也 许 永 远 无 需 了 解 调 试 组 w 件 的 细节， 
因为 它们 通常 只 是 由 调试 器 及 其 周边 工具 使 用 的 。 

本 章 对 每 种 调试 组 件 做 一 个 基本 的 介绍 ， 如 本 需要 了 解 它们 的 更 详细 信息 ， 如 编程 模型 ， 则 请 
参阅 《Cortex-M3 Technical Reference Manual(Ref1) 》。 

所 有 的 调试 及 跟踪 组 件 , 以 及 FPB, 都 可 以 经 由 CM3 的 私有 外 设 总 线 来 编程 。 在 大 多 数 情 况 下 ， 
只 有 调试 主机 才 会 编程 这 些 组 件 。 强 烈 反 对 应 用 程序 尝试 访问 调试 组 件 (除了 对 ITM 中 stimulus 
并 口 守 存 器 的 访问 )， 这 样 做 很 容 多 与 调试 器 友 生 冲突 。 


16.1.1 Cortex-M3 的 跟踪 系统 


如 前 所 述 ，CM3 的 跟踪 系统 是 基于 CoreSight 架构 的 ， 跟 踪 数 据 被 打 成 数据 包 ， 并 且 它 们 的 长 
度 可 变 。 跟 踩 组 件 使 用 高 级 跟踪 总 线 (ATB) 来 发 送 这 些 数据 包 给 TPIU，TPIU 则 把 它们 格式 化 ， 
转换 成 行 合 “跟踪 忌 线 接口 协议 ”的 数据 包 。 格 式 化 后 的 数据 包 发 到 厂 外 ， 可 以 使 用 跟踪 问 口 分 析 
仪 TPA) 之 类 的 设备 捕获 它们 。 整 个 数据 流动 的 路 线 如 图 16.1 所 示 : 




















Cortex-M3 必 片 边界 
片 | 片 
Cortex-M3 | 
处 理论 核心 内 ， 外 
指令 跟踪 | 
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16.1 Cortex-M3 的 消化 系统 模式 图 
从 上 图 可 见 ， 在 CM3 中 可 以 有 3 种 跟踪 源 : ETM，ITM 和 DWT。 其 中 ，ETM 是 一 个 可 选 组 件 ， 
因此 有 些 CM3 芯片 中 没有 配 。 在 操作 中 ， 每 个 跟踪 源 都 被 赋予 一 个 7 位 的 ID 号 (ATID)， 随 着 它 
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所 发 出 的 数据 包 一 起 送出 。 这 样 ， 在 从 归并 的 数据 流 中 还 原 各 原始 的 数据 流 时 ， 束 可 以 使 用 ATID 
来 作为 识别 的 手段 。 与 其 它 标 准 的 CoreSight 组 件 不 同 的 是 ，CM3 的 调试 组 件 内 建 了 归并 ATB 数 
据 流 的 逻辑 ， 而 在 标准 的 CoreSight 系统 中 ，ATB 数据 包 归 并 器 是 一 个 独立 的 功能 块 ， 并 且 被 称 为 
“ATB funne1 ”。 

在 使 用 跟踪 系统 之 前 ， 必 须 把 DEMCR.TRCENA 置 位 〈 回 顾 表 15.2， 或 者 参阅 表 D.37)。 在 这 
之 前 ， 跟 踩 系统 是 处 于 除 能 状态 的 。 在 正 第 的 操作 中 ， 如 有 条 不 需要 跟踪 ， 则 通过 清 堆 TRCENA 来 除 
能 一 些 与 跟踪 有 关 的 逻辑 ， 可 以 降低 系统 的 功 耗 。 


16.2 跟 蹊 组 件 : 数据 观察 点 与 跟 路 (DWT) 


本 节 的 主角 是 DNT， 它 提供 的 调试 功能 包括 : 
1. 它 包 含 了 4 个 比较 器 ， 可 以 配置 成 在 发 生 比 较 匹 配 时 ， 执 行 如 下 动作 : 
a) 便 件 观察 点 《产生 一 个 观察 点 调试 事件 ， 并 且 用 它 来 调用 调试 模式 ， 包 括 俘 机 模式 和 
调试 监视 右 模 式 
b) ETM 触发， 可 以 触发 ETM 友 出 一 个 数据 包 ， 并 汇 入 指令 跟 踊 数据 流 中 
c) 程序 计数 器 (PC) 采样 器 事件 触发 
d) 数据 地 址 采样 器 触发 
e) 第 一 个 比较 堪 还 能 用 于 比较 时 钟 周期 计数 器 〈CYCCNT)， 用 于 取代 对 数据 地 址 的 比较 
2. 作为 计数 器 ，DWT 可 以 对 下 列 项 目 进行 计数 : 
a) 时钟 周 期 (CYCCNT) 
b) 被 折 县 (Folded) 的 指令 
c) 对 加 载 / 存 储 单元 〈LSU) 的 操作 
d) 睡眠 的 时 钟 周期 
e) 每 指令 周期 数 (CPI) 
f) 中 上 断 的 额外 开销 (overhead) 
3。 以 固定 的 周期 采样 PC 的 值 
4 中断 事 件 跟 踩 
当 用 于 人 硬件 观察 点 或 ETM 触发 时 ， 比 较 器 既 可 以 比较 数据 地 址 ， 也 可 以 比较 程序 计数 器 PC。 
当 用 于 其 它 功能 时 ， 比 较 器 则 只 能 比较 数据 地 址 。 
每 一 个 比较 器 都 有 3 个 寄存 器 
@ COMP 寄存 器 
@ MASK 寄存 器 
@ FUNCTION 控制 寄存 器 
其 中 ，COMP 寄存 器 是 一 个 32 位 寄存 器 ， 用 于 存储 要 比较 的 值 。MASK 天 存 器 可 以 用 于 掩 菩 数 
据 地 址 的 一 些 位 ， 被 掩蔽 的 位 不 参与 比较 。 如 表 16 .1 所 示 : 


表 16.1 MASK 寄存 器 定义 


IC 被 忽略 的 位 段 
dl 忽略 所 有 的 位 
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EEC 
后 驮 RDDROEE 






比较 器 的 FUNCTION 寄存 器 用 于 决定 该 比较 器 的 功能 。 为 了 避免 潜在 的 不 可 预料 的 行为 ， 必 须 
先 编程 MASK 和 COMP， 最 后 再 编程 RUNCTION。 如 果 要 更 改革 个 比较 器 的 功能 ， 必 须 先 把 FUNCTION 











清 零 一 一 除 能 该 比较 器 ， 再 重新 配置 一 回 ， 依 然 是 最 后 配置 FUNCTION。 

DWT 中 有 剩余 的 计数 器 ， 它 们 典型 地 用 于 程序 代码 的 “性 能 速写 ”(Cprofiling)。 通 过 编程 它 
们 ， 就 可 以 让 它们 在 计数 器 溢出 时 发 出 事件 (以 跟踪 数据 包 的 形式 )。 最 典型 地 ， 就 是 使 用 CYCCNT 
寄存 器 来 测量 执行 某 个 任务 所 花 的 周期 数 , 这 也 可 以 用 作 时 间 基 ; 准 相关 的 目的 (操作 系统 中 统计 CPU 
使 用 率 可 以 用 到 它 )。 


16.3 跟 路 组 件 : 仪器 化 跟 路 实 蛙 元 (ITM ) 


ITM 有 如 下 的 功能 : 

@ 软件 可 以 直接 把 控制 台 消 息 写 到 ITM stimulus 端口 ， 从 而 把 它们 输出 成 跟踪 数据 。 

@ DWT 可 以 产生 跟踪 数据 包 ， 并 通过 ITM 把 它们 输出 。 

@ ITM 可 以 产生 时 间 惟 数据 包 并 插入 到 跟踪 数据 流 中 ， 用 于 帮助 调试 右 求 出 各 事件 的 发 生 时 

[国有 

因为 ITM 要 使 用 跟踪 问 口 来 输出 数据 ， 所 以 忆 片 上 必须 有 TPIU 单元 ， 否 则 无 法 输出 一 一 在 使 
用 ITM 前 要 确认 此 事 。 如 果 不 幸 地 没有 TPIU， 也 还 可 以 使 用 NVIC 调试 寄存 器 ， 或 者 使 用 最 后 一 招 
一 一 求助 于 UART 来 输出 控制 台 消息 。 

欲 使 用 ITM， 必 须 把 DEMCR .TRCENA 位 置 位 ， 否 则 ITM 处 于 除 能 状态 ， 无 法 使 用 。 

另外 , 在 ITM 寄存 器 中 还 有 一 个 锁 。 在 编程 ITM 之 前 ,必须 写 入 一 个 访问 钥匙 值 exC5AC_CE55 

(CoreSight 的 ACCESS) 到 这 个 解锁 寄存 器 。 否 则 ， 所 有 对 ITM 寄存 占 的 写 操作 都 被 忽略 。 

最 后 ，ITM 上 自己 也 是 另 一 个 控制 寄存 器 《〈 可 能 是 说 控制 寄存 器 的 名 字 也 是 “ITM” 吧 )， 用 于 控 
制 对 各 功能 的 独立 使 能 。 

控制 寄存 器 中 含 了 ATID 位 段 ， 作 为 ITM 在 ATB 中 的 ID 值 。 这 个 ID 必须 是 唯一 的 一 一 每 个 跟 
踪 源 都 必须 有 唯一 的 ID 值 ， 从 而 使 调试 主机 能 从 接收 到 的 跟踪 数据 包 中 分 离 出 各 跟踪 源 的 数据 。 


16.3.1 基于 ITM 的 软件 跟 路 


ITM 的 一 个 主要 用 途 ， 就 是 支持 调试 消息 的 输出 (例如 ，printf 格式 的 输出 ) ITM 包含 了 32 
个 刺激 (stimulus) 问 口 ， 允 许 不 同 的 软件 把 数据 输出 到 不 同 的 端口 ， 从 而 让 调试 主机 可 以 把 它们 
的 消息 分 离开 。 通 过 编程 “跟踪 使 能 寄存 器 ”， 每 个 端口 都 可 以 独立 地 使 能 / 除 能 ， 还 可 以 允许 或 禁 
止 用 户 进 程 对 它 执行 写 操作 。 

与 基于 UART 的 文字 输出 不 同 ， 使 用 ITM 输出 不 会 对 应 用 程序 造成 很 大 的 延迟 。 在 ITM 内 部 有 
一 个 FIF0， 它 使 号 入 的 输出 消息 得 到 缓冲 。 不 过 ， 为 了 安全 起 见 ， 最 好 还 是 在 写 入 前 检查 该 FIFO 
被 填 满 的 程度 。 

输出 的 消息 被 送 往 TPIU， 然 后 可 以 通过 “跟踪 端口 接口 ”或 者 “ 串 行 线 接口 来 收集 它们 。 在 
最 终 的 代码 中 也 无 需 移 除 产生 调试 消息 的 代码 ， 而 是 可 以 把 TRCENA 位 清 零 ， 这 样 ITM 就 被 除 能 ， 


231 













































































Cortex-M3 权威 指南 第 16 章 


调试 消息 也 不 会 输出 ， 你 也 可 以 在 一 个 “live” 系 统 中 开启 消息 输出 。 另 外 ， 通 过 设置 跟踪 使 能 寄 
存 器 ， 可 以 限定 允许 使 用 的 端口 。 


16.3.2 基于 ITM 和 DWT 的 硬件 跟踪 


ITM 也 能 用 于 输出 人 硬件 跟踪 数据 ， 这 些 数 据 由 DWT 产生 ，ITM 则 担任 跟踪 数据 包 的 归并 单元 ， 
如 图 16.2 所 示 。 售 使 用 DWT 跟踪 ， 需 要 在 ITM 控制 寄存 器 中 置 位 DWTEN 位 ， 剩 下 的 DWT 跟踪 设置 


在 DWT 中 完成 。 


S 0 外 部 的 跟踪 
DWT 和 TPIU 捕获 设备 ,如 
全 月 并 的 跟踪 数据 分 析 仪 


数据 包 1 
时 间 玲 发 生 器 
来 自 ETM 的 


跟踪 数据 包 























16.2 在 ITM 和 TPIU 上 的 数据 包 归 并 模式 图 


16.3.3 ITM 时 间 惟 


ITM 还 附 珊 了 一 个 时 间 惟 的 功能 : 当 一 个 新 的 跟踪 数据 包 进 入 了 ITM 的 FIFO 时 ，ITM 就 会 把 
一 个 差分 的 时 间 惟 数据 包 搬 入 到 跟踪 数据 流 中 。 跟 踩 捕获 设备 在 得 到 了 这 些 时 间 惟 后 ， 就 可 以 找 出 
各 跟踪 数据 之 间 的 时 间 相 关 信 息 。 另 外 ， 在 时 间 惟 计数 器 液 出 时 也 会 发 生 时 间 惟 数据 包 。 


16.4 跟 蹊 组件 : 突入 式 跟 路 宏 单 元 


ETM 功能 块 用 于 提供 指令 跟踪 ( 即 指令 执行 的 历史 记录 )， 它 是 个 选 配件 , 不 一 定 出 现在 所 有 的 
CM3 产品 上 。 当 它 使 能 后 , 并 且 在 跟踪 操作 开始 后 , 它 会 产生 指令 跟 躁 数据 包 。 ETM 中 也 有 一 个 FIFO 
绥 冲 区 ， 为 跟 躁 数据 流 的 捕捉 提供 够 用 的 时 间 。 

为 了 减少 产生 的 数据 量 ，ETM 并 不 会 一 直 忙 不 迭 地 输出 处 理 器 当前 正在 执行 的 地 址 。 通 常 它 只 
输出 有 关 程 序 执行 流 的 信息 ， 并 且 只 有 在 需要 时 才 输 出 完整 的 地 址 〈 例 如 ， 当 一 个 跳 转发 生 时 )。 
为 调试 主机 也 有 一 份 二 进 制 嗣 像 的 拷贝 ， 它 可 以 使 用 此 找 贝 来 重建 指令 的 执行 序列 。 

ETM 也 与 其 它 的 调试 组 件 互相 交互 。 例 如 ， 它 与 DWT 的 比较 器 束 有 关系 : DWT 的 比较 右 可 用 于 
产生 ETM 的 触发 信号 ， 或 者 控制 跟 踩 的 启动 与 停止 。 

与 传统 ARM 处 理 器 的 ETM 不 同 的 是 ，CM3 的 ETM 没有 自己 的 地 址 比较 器 ， 而 是 由 DWT 的 比较 
器 代为 完成 。 事 实 上 ，CM3 的 ETM 与 传统 ARM 的 ETM 有 很 大 的 区 别 。 

欲 使 用 ETM， 必 须 执 行 下 述 的 建立 步骤 (由 调试 器 及 其 周边 工具 完成 ) 

1. 把 DEMCR.TRCENA 位 置 位 (DEMCR 寄存 器 的 定义 参见 表 15.2 或 D.37)。 

2. 解锁 ETM 以 编程 它 的 寄存 器 : 往 ETMLOCK_ACCESS 寄存 器 中 写 @xC5AC CE55。 

3. 编程 ATBID 寄存 器 CATID), 赋 予 ETM 一 个 唯一 的 标识 ， 以 便 把 它 的 跟踪 数据 包 与 其 它 跟 

踩 源 的 跟 踩 数据 包 分 开 。 
4. ETM 的 NIDEN 输入 信号 必须 为 高 电 平 。 该 信号 的 实现 是 取决 于 具体 的 器 件 的 ， 还 需要 参考 
该 器 件 的 数据 手册 。 
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5 。 编程 ETM 控制 寄存 需 组 以 产生 跟踪 数据 。 


16.5 跟踪 组 件 : 跟踪 端口 接口 单元 ( TPIU ) 


如 前 所 述 ，ITM，DWT 和 ETM 的 跟踪 数据 都 在 TPIU 处 汇聚 。TPIU 用 于 把 这 些 跟 踪 数 据 格式 化 
并 输出 到 片 外 ， 以 供 跟踪 端口 分 析 仪 之 类 的 设备 接收 使 用 。CM3 的 TPIU 支持 两 种 输出 模式 : 

@ ”市 时 钟 模式 (Clocked mode)， 使 用 最 多 4 位 的 并 行 数据 输出 端口 

@ 串 行 线 观 察 锋 〈SWV) 模式 ， 使 用 单一 位 的 SWV 输 出 (不 适用 于 早期 版 本 的 CM3) 

在 带 时 钟 模式 下 ， 数 据 输出 端口 实际 使 用 的 位 数 是 可 编程 的 。 这 取决 于 两 点 。 其 一 ， 是 芯片 的 
封装 ; 其 二 , 是 在 应 用 中 , 提供 了 多 少 个 信号 引 脚 给 跟踪 输出 使 用 。 在 具体 的 芯片 中 , 通过 检查 TPIU 
的 寄存 器 ， 可 以 判断 跟踪 端口 的 最 大 尺寸 。 此 外 ， 跟 踪 数 据 输出 的 速度 也 是 可 编程 的 。 

在 SWV 模 式 下 ， 则 使 用 SWV 协 议 。 它 减少 了 所 需 的 输出 信号 数 ,， 但 是 跟踪 输出 的 最 大 的 带宽 也 减 
少 了 。 

欲 使 用 TPIU， 需 要 先 把 DECMR.TRCENA 置 位 ， 还 要 编程 “协议 选择 寄存 器 ”和 “跟踪 端口 尺寸 
寄存 器 ” 这 个 工作 由 跟踪 捕捉 软件 完成 。 
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在 SWV 模式 下 ， 会 使 用 SWV 协议 。 这 时 ， 输 出 信号 束 只 需要 1 个 比特 了 ， 但 是 跟 
踩 输 出 的 最 高 市 宽 也 会 下 降 。 另 外 ， 在 使 用 串 行 线 调试 协议 时 ，SWYV 模式 的 输出 可 以 和 
TDO 共 胖 信号 线 。 这 样 一 来 ， 哪 介 使 用 只 寓 有 标准 JTAG 接口 的 入 门 级 调试 器 ， 也 可 以 
通过 DWT 和 ITM 来 捕捉 跟踪 信息 。 








16.6 闪存 地 址 重 载 及 断 点 单元 ( FPB ) 


FPB 有 两 项 功能 : 

@ 便 件 断 点 文 持 。 产 生 一 个 断 点 事件 , 从 而 使 处 理 器 进入 调试 模式 ( 集 机 或 调试 监视 器 异常 ) 
@ ”把 代码 地 址 空间 中 对 指令 或 字面 值 (1iteral data) 的 加 载 ， 重 载 到 SRAM 的 地 址 空间 中 。 
FPB 有 8 个 比较 器 ， 分 别 是 : 

@ 6 个 指令 比较 器 

@ 2 个 字面 值 比较 器 
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什么 是 “字面 值 加 载 ”? 


当 我 们 使 用 汇编 写 程序 时 ， 第 钊 需要 往 寄存 噩 中 加 载 立 即 数据 。 当 立即 数 的 值 很 大 
时 ， 加 载 操 作 束 无 法 用 单一 指令 完成 ， 例 如 : 

LDR RO, =0xEOO0OE400 

因为 没有 任何 指令 能 接收 32 位 立即 数 ， 我 们 需要 把 这 个 立即 数 预 先 安置 到 男 一 个 存 
储 恬 容 间 中 ， 通 党 放 到 程序 代 公 区 的 后 面 ， 然 后 束 可 以 使 用 一 条 相对 PC 的 加 载 指 令 ， 来 
读 取 这 个 立即 数 到 对 应 的 寄存 器 中 。 因 此 ， 上 条 代码 的 汇编 结果 可 以 如 下 所 示 : 

LDR RO, [PC, #<immed 8>*4] 

; immed_8 = (字面 值 地 址 - PC)/4 











; 文字 池 


DCD OxEOOOE400 


上 面 的 LDR 也 可 以 是 Thumb-2 提 供 的 32 位 版 本 : 


LDR.W RO, [PC, #+/—<offset 12>] 
offeseeen > (i pe 


; 文字 池 


DCD OxEOOOE400 











在 实际 使 用 中 我 们 经 常 需 要 在 代码 中 使 用 多 个 字面 值 ， 沪 编 器 或 编译 器 就 会 在 代码 
区 中 开 出 一 块 地 址 邦 围 ， 来 集合 字面 值 ， 这 个 块 束 是 所 谓 的 “文字 池 ”。 在 CM3 中 ， 从 文 
字 池 的 数据 加 载 通常 使 用 D-Code 总 线 , 但 比较 男 类 的 实现 也 可 以 把 文字 池 放 到 RAM 区 中 ， 
从 而 使 用 系统 总 线 加 载 。 








在 FPB 中 有 一 个 办 存 地 址 重 载 控制 寄存 器 ， 它 包含 了 FPB 的 使 能 位 。 此 外 ， 每 个 比较 器 在 它 目 己 
的 控制 寄存 器 中 ， 痢 还 有 各 目的 使 能 位 前 者 是 总 开关 。 两 种 使 能 位 必须 都 为 1 时 才能 启用 比较 
ee 

可 以 通过 编程 比较 器 , 把 指令 空间 的 地 址 重 载 ( 重 映射 ) 到 SRAM 地 址 空间 中 。 当 使 用 此 功能 时 ， 
需要 编程 REMAP 寄 存 器 ， 以 提供 需要 重 映 射 内 容 的 基 址 。REMAP 寄 存 器 的 最 高 3 位 [31:29] 被 便 线 连 
接 成 gbb861,， 因此 限定 了 重 映 射 后 的 地 址 范围 在 6x2666 6666-8x3FFF FF86 之 间 , 这 段 地 址 正好 落 














在 SRAM 地 址 空间 中 。 
当 指 令 地 址 或 字面 值 地 址 与 比较 器 中 的 数值 发 生 匹配 命中 时 ， 读 访问 就 会 根据 REMAP 的 设置 被 
重 映 射 。 





使 用 这 个 重 映 射 功 能 ， 可 以 创建 一 些 “ 如 果 .. .将 会 .”(what if) 形式 的 测试 一 一 通过 把 原 
始 指令 或 字面 值 取代 成 态 一 个 来 实现 。 并 且 即 使 是 在 ROM 或 flash 中 运行 的 代码 , 也 能 够 参与 此 种 训 
试 。 万 一 种 用 法 在 本 质 上 与 这 种 用 法 相同 ， 但 被 取代 的 是 跳 较 指令 ， 因 此 行为 很 像 “狸猫 换 太 子 ”: 
对 于 东 个 位 于 flash 中 的 子 程序 ， 在 SRAM 中 提供 一 个 冒充 它 的。 通过 内 存 地 址 重 载 ， 使 得 在 执行 到 
调用 该 子 程序 的 指令 (BL) 时 ， 实 际 上 执行 的 是 被 “调包 ”过 的 ， 位 于 SRAM 中 的 BL， 后 者 则 跳 转 到 
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“狸猫 ”中 。 这 种 机 制 使 得 基于 ROM 的 设备 也 可 以 调试 〈 修 改过 的 子 程序 暂时 放 到 SRAM 中 )。 
下 图 演示 了 和 草 映 射 的 效 来 


重 映 射 操作 


SRAM 区 


REMAP 基 址 


Ox2000 0000 


6 号 比较 器 


1 号 比较 器 代码 区 


0 号 比较 器 


2 号 比较 器 
0x0000 0000 





图 16.3 ”闪存 地 址 重 载 : 对 指令 及 字面 值 的 重 映 射 


除了 地 址 重 载 ， 指 令 地 址 比较 右 的 万 一 项 功能 ， 吏 是 用 于 产生 使 件 断 点 《〈 共 6 个 )， 当 地 址 匹配 
时 使 处 理 需 进入 调试 模式 。 


16.7 AHB 访问 况 口 


AHB-AP 位 于 CM3 的 存储 器 系统 和 调试 接口 模块 (SWJ-DP/SW_DP) 之 间 ， 充 当 一 个 总 线 桥 的 角 
色 。 对 于 大 多 数 基本 的 在 调试 主机 和 CM3 系 统 之 则 的 数据 传输 , 只 需要 使 用 AHB-AP 中 的 3 个 寄存 右 ， 
它们 是 : 

@ 控制 及 状态 字 (CSW) 

@ ”传输 地 址 寄存 器 (TAR) 

@ 数据 读 / 写 (DRMW) 

AHB-AP 的 连接 方法 如 图 16.4 所 示 : 
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Cortex-M3 心 片 








SW-DPR 或 — 控制 ” AHB 
SWJ-DP DRW /4 总 线 息 









图 16.4 在 Cortex-M3 中 AHB-AP 的 连接 
CSW 守 存 絮 可 以 控制 传送 方 同 ( 读 / 写 )、 传 送 大 小 以 及 传送 类 型 等 TAR 寄存 器 则 指令 传送 地 址 ， 








而 DRW 寄 存 占 则 容纳 了 被 传送 的 数据 (在 访问 该 寄存 器 时 就 局 动 了 传送 )。DRW 中 的 数据 与 总 线 上 实 
际 显示 的 是 一 致 的 ， 所 以 对 于 半 字 和 字 节 传送 ， 必 须 由 调试 硬件 把 得 到 的 数据 适当 移 位 ， 以 对 齐 到 
LSB。 例 如 ， 大 和 欲 在 地 址 96x1662 上 执行 一 次 半 罕 传送, 则 需要 把 数据 放 到 DRw 的 [31:16] 上 。AHB-AP 
可 以 产生 非 对齐 传 送 ， 但 是 它 不 会 根据 地 址 偏 移 来 自动 对 目标 数据 做 圆 财 移 位 ， 必 须 由 调试 软件 墙 
上 这 个 寅 密 : 要 么 手工 圆圈 移 位 ， 要 么 把 未 对 齐 访问 分 解 为 若干 个 对 齐 的 访问 。 

在 AHB-AP 中 还 有 其 它 的 寄存 器 ， 它 们 提供 附加 的 功能 。 例 如 ，AHB-AP 中 提供 了 4 个 bannked 寄 
存 右 和 地 址 日 动 增 量 的 功能 ， 用 于 加 快 在 小 范 赎 连续 地 址 中 数据 访问 的 速度 。 

在 CSW 寄 存 器 中 ， 还 有 一 个 名 为 MasterType 的 位 。 通 第 需要 把 它 置 1， 以 此 告知 参与 AHB-AP 数 
据 传送 的 人 硬件 : 该 数据 传送 是 调试 器 发 起 的 。 但 是 ， 调 试 器 也 可 以 清 零 此 位 来 伪装 成 处 理 器 内 核 。 
这 样 ， 在 AHB 上 接收 数据 的 便 件 束 会 以 为 是 内 核发 起 的 数据 传送 ， 从 而 正常 地 动作 。 这 个 功能 可 以 
用 于 测试 目的 ， 尤 其 是 对 于 市 有 FIFO 的 外 设 ， 用 于 获知 当 它 补 调 试 右 访 问 时 ， 行 为 有 什么 不 同 。 


























16.8 ROM 表 


CM3 的 调试 系统 还 包含 了 ROM 表 ， 用 于 上 自动 检测 在 某 CM3 心 族 中 包含 了 哪些 调试 组 件 。 尽 管 作 为 
v7-M 的 第 一 个 践 行者 ，CM3 拥 有 一 个 预定 义 的 存储 器 映 册 并 且 包 含 了 标准 的 调试 组 件 ， 但 是 新 的 
Cortex-M 器 件 可 以 包含 不 同 的 调试 组 件 ， 并 且 忌 片 厂商 在 实现 CM3 时 也 可 以 对 调试 组 件 加 以 修改 。 
为 使 调试 工具 能 检测 到 调试 系统 中 具体 包含 的 组 件 ， 就 提供 了 这 张 ROM 表 ， 它 记录 了 NVIC 和 各 个 调 
试 功能 块 的 地 址 。 

ROM 表 位 于 exE886F_F888。 通过 分 析 ROM 表 中 的 内 容 , 可 以 计算 出 系统 和 调试 组 件 在 存储 器 系统 
中 的 位 置 。 在 检测 到 了 调试 组 件 后 ， 调 试 器 可 以 接 下 来 查看 它们 的 ID 寄存 器 ， 从 而 判定 系统 中 哪些 
组 件 是 可 用 的 。 

在 CM3 的 ROM 表 中 ， 第 一 条 目的 内 容 应 当 是 : NVIC 的 入 口 地 址 相对 于 ROM 表 入 口 地 址 的 偏 移 量 。 
ROM 表 首 条 目的 缺 省 值 是 gexFFF6F663， 其 中 位 段 [1:6] 的 作用 比较 特殊 : 它 指示 本 条 目 对 应 的 设备 
是 存在 的 ， 并 且 在 本 条 目的 后 面 还 有 后 续 的 条 目 《〈 也 就 是 说 本 条 目 不 是 最 后 一 个 条 目 )。 这 样 ， 通 
过 第 一 个 条 目 ， 我 们 就 知道 系统 中 有 NVIC， 并 且 还 有 第 2 个 条 目 ， 而 且 还 能 计算 出 NVIC 的 地 址 为 
OxE66F _F666+6XxFFF6 F666=9XxE666 _E666。 

缺 省 的 ROM 表 如 图 16.2 所 示 。 但 是 因为 芯片 三 商 可 以 添加 、 移 除 以 及 把 某 些 可 选 的 组 件 蔡 换 成 
其 它 的 CoreSigth 调 试 组 件 ， 这 时 该 芯片 的 ROM 表 就 会 与 缺 省 的 有 所 不 同 ， 以 反映 出 相应 的 变化 。 
表 16.2 Cortex-M3 缺 省 的 ROM 表 
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地 址 数值 名 称 功能 

9XxE66F F666 6XxFFF6 F663 NVIC 指 问 NVIC 的 基 址 ，@8xE888_E880 

OxE66F F664 6xFFF6 2663 DWT 指 问 DWT 的 基 址 : 6xE666_1666 

OxE66F F668 6xFFF6 3663 FPB 指向 FPB 的 基 址 :; 6xE666 2666 

9XxE66F F66C 6XxFFF6 1663 IT™M 指 问 ITM 的 基础 : 6XxE666 6666 

9XxE66F F616 QxFFF4 1663/ TPIU 指向 TPIU 的 基 址 : 9XxE664 6666 
9xFFF4 1662 

OxE66F F614 6xFFF4 2063 ETM 指向 ETM 的 基 址 : 6xE664 1666 
9xFFF4 2662 

OXxE66F _F618 0 End End-0f-Table 标 记 

OXxEO6F_F6CC 1 MEMTYPE 表示 在 此 存储 需 上 映射 中 ， 可 以 访问 系统 存储 需 

9XxEO6F F6D6 6 PID4 外 设 ID 空 间 ， 保 留 

OxE66F F6D4 6 PID5 外 设 ID 空 间 ， 保 留 

@xE66F F6D8 6 PID6 wh TD | 

exE66F FeDC 6 PID7 外 设 ID 空 间 ， 保 留 

@xE66F F6E6 6 PID6 外 设 ID 空间 ， 保 留 

OxE66F FOE4 6 PID1 外 设 ID 空 间 ， 保 留 

OxE66F FOE8 6 PID2 2 

OxE66F FOEC 6 PID3 外 设 ID 空 间 ， 保 留 

OxE66F FOF6 6 CID6 组 件 ID 空 间 ， 保 留 

OxE66F FeF4 6 CID1 组 件 ID 空间 ， 保 留 

OxE66F FF8 0 CID2 组 件 ID 空 间 ， 保 留 

OxE66F FOFC 6 CID3 组 件 ID 空间 ， 保 留 








数值 的 最 低 两 个 位 用 于 指示 该 设备 是 否 存在 (bit[1]) 以 及 后 面 还 有 没有 其 它 的 表 项 (bit[6])。 
在 正常 情况 下 ，NVIC，DWT 和 FPB 总 是 必须 存在 的 ， 因 此 最 后 两 位 永远 是 1。 然 而 ，TPIU 和 ETM 则 可 
以 被 裁 掉 ， 并 且 可 能 被 CoreSsight 家 庭 中 其 它 的 调试 组 件 所 取代 。 

数值 的 高 位 部 分 用 给 出 对 应 组 件 的 入 口 地 址 相对 于 ROM 表 入 口 地 址 的 偏 移 量 。 例 如 ， 

NVIC 入 口 地 址 = 6xE66F F666 + 6XxFFF6 F688 = 9XxE666 E668 (进位 位 被 忽略 ) 

在 开发 调试 工具 时 ， 有 必要 从 ROM 表 中 一 一 伍 兄 各 调试 组 件 ， 因 为 难免 会 有 些 男 类 的 CM3 心 片 会 
自 定义 调试 组 件 ， 并 日 修 改 ROM 表 ， 而 通过 计算 ROM 表 得 到 的 地 址 是 可 以 拿 去 拍板 的 。 
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开始 Cortex-M3 开 友 


选择 一 和 款 Cortex-M3 产品 

Cortex-M3 修订 版 6 与 修订 版 1 的 区 别 
Cortex-M3 修订 版 1 与 修订 版 2 的 区 别 
J 


17.1 选择 一 次 Cortex-M3 产品 





在 根据 目 己 的 应 用 选择 具体 的 CM3 蕊 请 时 ， 除 了 要 考虑 存储 禹 、 外 设 配置 以 及 最 噩 主 频 之 外 ， 
其 它 一 些 因 素 也 会 使 一 款 CM3 忆 片 与 众 不 同 ，CM3 的 设计 允许 下 列 参数 是 可 以 配置 的 ， 它 们 是 : 














外 中 断 的 数目 
表达 优先 级 的 位 数 〈 优 先 级 寄存 喜 的 有 效 宽 度 ) 
是 否 配备 了 MPU 





是 售 配备 了 ETM 
对 调试 接口 的 选择 〈SNW，]JTAG 或 两 者 兼 有 ) 








对 于 大 多 数 项 目 而 言 ， 单 片 机 的 功能 和 规格 我 们 在 选择 时 的 首要 考虑 因素 ， 例 如 : 


上 


外 设 。 对 于 大 多 数 的 项 目 ， 厂 载 的 外 设 是 最 重要 的 选择 依据 。 外 设 也 并 非 多 多 荔 善 ， 因 为 
它 会 影响 到 功 耗 和 价格 。 

存储 器 : CM3 单片机 的 闪存 可 以 少 到 几 KB， 多 至 几 MB。 此 外 ， 片 内 RAM 的 容量 也 是 很 重 
要 的 。 这 些 参数 往往 对 价格 有 重大 的 冲击 。 

时 钟 速度 : CM3 的 设计 可 以 在 9.18um 的 粗 线条 工艺 上 ， 也 轻松 上 到 16eMHz。 然 而 ， 因 为 
存储 堪 访 问 速度 的 限制 ， 心 片 三 商会 降低 最 大 主 频 。 

脚印 : CM3 单片机 的 封装 也 多 种 多 样 。 很 多 CM3 单片机 的 脚 数 都 比较 少 ， 以 使 之 更 适合 于 
低 成 本 的 应 用 中 。 








17.2 CortexM3 修订 版 0 与 修 tJ 版 1 的 区 别 


早期 的 Cortex-M3 产品 是 基于 Cortex-M3 处 理 器 修订 版 6 的 在 2666 年 第 3 季度 之 后 的 CM3 
产品 可 以 使 用 修订 版 1。 在 本 书 出 版 之 时 ， 所 有 的 新 CM3 器 件 应 该 都 是 基于 修订 版 1 的。 了 解 自己 
使 用 的 蕊 片 基 于 哪个 修订 版 是 很 重要 的 ， 因 为 在 修订 版 1 中 作出 了 许多 重要 的 改变 和 改进 。 在 本 书 
前 面 草 季 中， 都 是 按 新 的 修订 版 1 来 叙述 的 。 

在 翻译 本 书 时 ， 有 两 个 CM3 芯片 生产 商 ， 分 别 是 Luminary 和 ST。 译 者 查看 了 它们 的 资料 ， 判 定 它们 都 是 使 
用 修订 版 1 的 处 理 右 的 。 后续 会 有 更 多 的 CM3 必 片 生产 商 ， 但 它们 肯定 不 会 使 用 老 的 修订 版 6 了 。 

在 编程 模型 中 可 以 看 见 的 改变 包括 如 下 内 容 : 














从 修订 版 1 开始， 啊 应 异常 时 的 盏 存 右 操作 可 以 被 配置 成 强制 对 痢 a 到 双 衬 边界， 这 可 以 通 
过 置 位 NVIC _CCR.STKALIGN 来 启用 。 

因为 刚才 的 理由 ，NVIC _CCR 中 加 入 了 STKALIGN 位 

修订 版 1 的 修订 版 中 引入 了 新 的 AUXFAULT (辅助 fault) 状态 寄存 器 (可 选 ) 
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@ DWT 中 添加 了 诸如 数值 匹配 的 新 功能 

@ ID 寄存 器 的 值 因 修订 版 号 位 段 而 改变 

在 编程 模式 中 看 不 见 的 改变 更 多 ， 它 们 是 : 

代码 存储 空间 的 存储 器 属性 被 硬 线 连 接 到 可 绥 存 , 已 分 配 (allocated), 不 可 缓冲 , 不 可 共享 。 
这 会 影响 I-Code AHB 和 D-Code AHB， 但 是 不 会 影响 系统 总 线 接口 。 

文 持 在 I-Code AHB 和 D-Code AHB 间 的 总 线 复 用 操作 。 在 此 操作 模式 下 ， 可 以 使 用 一 个 简单 
的 总 线 复 用 器 来 把 I-Code 和 D-Code 归并 (merge)， 这 可 以 降低 总 门 数 ， 旧 修订 版 的 则 必须 使 用 
ADK 总 线 窍 阵 组 件 。 

新 添加 了 用 于 连接 AHB 跟踪 单元 (HTM) 的 输出 端口 .AHB 是 一 个 CoreSight 中 定义 的 调试 组 件 ， 
服务 于 复杂 的 数据 跟踪 操作 。 

调试 组 件 或 调试 寄存 器 可 以 在 系统 复位 期 间 访 问 ， 只 有 在 上 电 复 位 时 才 无 法 访问 。 

在 修订 版 1 中 ，NVIC_ICSR.VECTPENDING 位 段 可 以 受 NVIC_DHCSR.C_MASKINTS 位 的 影响 : 
当 C_MASKINTS 置 位 时 ， 如 果 掩 毅 了 一 个 悬 起 的 中 断 ， 会 使 VECTPENDING 的 值 为 堆 。 

JTAG-DP 调试 接口 被 SWJ-DP 模块 取代 。 但 是 仍然 允许 已 片 三 商 使 用 JTAG-DP， 因 为 它 也 是 
CoreSight 家 庭 中 的 成 员 。 

因为 修订 版 8 的 CM3 在 啊 应 异 音 时 没有 双 字 对 齐 堆栈 的 功能 ， 有 些 编译 器 ， 如 ARM 的 RVDS 和 
Keil 的 RVMDK ， 都 提供 了 特殊 的 编译 选项 以 决定 是 否 允 许 软 件 调 整 入 栈 ， 以 使 开发 出 来 的 产品 是 
EABI 兼容 的 ， 当 软件 需要 与 其 它 EABI- 兼 容 开 发 工具 时 ， 这 还 是 相当 重要 的 。 

为 了 判定 使 用 的 单片机 使 用 了 哪个 修订 版 的 CM3 内 核 ， 可 以 使 用 NVIC 中 的 CPUID 寄存 器 ， 
revison 和 变种 位 段 指 出 了 具体 使 用 的 CM3 修订 版 。 如 表 17.1 所 示 : 
表 17.1 CPUID 基 寄 存 器 


















































表 17.1 CPUID 基 寄 仔 器 ( 地址 : 0xE000_ED00 ) 


实现 者 变种 常数 PartNo Revision 
[31:24] [23:26] [19:16] [15:4] [3:@] 





译 者 查看 了 ST 的 STM32 系列 使 用 的 内 核 ， 得 到 的 结果 是 rip1。 
17.2.1 修订 版 1: 从 JTAG-DP 到 | SNJ-DP 


品行 线 JTAG 调试 端口 (SWJ-DP) 把 SW-DP 和 JTAG-DP 的 功能 合 二 为 一 ， 并 且 支 持 自 动 协议 
检测 。 使 用 这 个 组 件 ，CM3 设备 可 以 支持 both SN 和 JTAG 接口 。( 目 前 可 以 使 用 的 ， 由 LM 和 ST 
所 提供 的 蕊 片 都 是 使 用 了 SWJ-DP 一 一 译 者 注 )。 


240 


Cortex-M3 权威 指南 第 17 章 


调试 主机 (PC) 
| Cortex-M3 
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| 
| 
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17.1 SWJ-DP : 合并 了 咱 AG-DP 和 SW-DP 的 功能 


17.3 Cortex-M3 修订 和 版 工 与 修 苛 版 2 的 区 别 


在 2668 年 中 期 ，Cortex-M3 的 修订 版 2 发 布 了 。 估 计 到 2668 年 底 ， 在 市 场 上 束 能 见 到 基于 
修订 版 2 的 世 片 了 。 修 订 版 2 新 增 了 很 多 特性 ， 它 们 大 多 数 都 致力 于 降低 功 耗 以 及 提高 调试 的 灵活 
性 。 

在 修订 版 2 中， 程序 员 模式 也 跟 独 有 以 下 的 更 新 。 


17.3.1 双 字 堆栈 对 齐 万 式 成 为 缺 省 值 

影响 异常 入 栈 顺 序 和 内 存 使 用 的 双 字 堆栈 对 齐 方式 ,在 修订 版 2 中 成 为 缺 省 使 用 的 方式 (注意 : 
蕊 片 厂商 可 能 会 选择 使 用 修订 版 1 的 方式 )。 使 用 此 方式 ， 会 给 大 多 数 C 程序 减少 启动 代码 的 额外 
开销 《无需 再 在 NVIC 配置 控制 寄存 喜 中 置 位 STKALIGN 比特 )。 











17.3.2 新 增 辅 助 控 制 寄存 器 (Auxiliary Control Register) 


为 了 更 细 腊 地 调 校 处 理 喜 的 行为 方式 ， 新 增 了 辅助 控制 寄存 器 。 比 如 ， 为 了 调试 方便 ， 通 过 议 
置 此 寄存 器 ， 可 以 关闭 Cortex-M3 的 写 绥 冲 ， 从 而 使 总 线 faults 总 是 能 与 存储 器 访问 指令 同步 一 
一 也 就 是 说 使 总 线 faults 总 是 精确 的 。 这 样 ， 残 可 以 每 次 都 能 从 入 栈 的 返回 地 址 中 精确 地 揪 出 党 
事 指 令 了 。 

辅助 控制 寄存 器 的 细节 如 下 表 所 示 : 

辅助 控制 寄存 器 (8xE8686_E888) 





比特 号 ”学 段 名 类 型 初 值 功能 描述 
2 DISFOLD R/W 0 除 能 IT 折 秋 (folding), 使 IT 指令 


与 下 一 条 指令 (在 流水 线 中 ) 的 执行 
级 (execution phase) 不 会 交 迭 
1 DISDEFWBUF CR/W 0 在 缺 省 的 存储 器 映射 中 除 能 写 缓冲 
(对 由 MPU 映射 的 regions 不 起 作 
用 ) 
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9 DISMCYCINT R/W 9 除 能 “指令 可 中 断 ” 功 能 。 也 就 是 不 
再 打 断 LDM，STM，64 位 乘法 ， 以 及 
除法 指令 。 


17.3.3 ID 寄存 器 的 更 新 


在 NVIC 以 及 调试 组 件 中 的 很 多 ID 寄存 器 都 更 新 了 。 人 例如， 在 NVIC 中 的 CPUID 寄存 器 变 成 了 
CPUID 寄存 器 (6XxE666 Pe- 


光山 首 常数 PartNo Revision 
[31:24] Da 20] Ee 16] [15:4] : a 








修订 版 2 | ex41 OxC23 
(r2pe) 


17.3.4 调试 功能 


修订 版 2 对 调试 功能 有 了 好 几 处 改进 
@ DWT 中 的 观 硅 点 数据 跟踪 现在 文 持 两 种 新 的 跟 踩 方式 : 仅 跟 踩 谈 传 大, 以 及 仅 跟 踩 写 传达 。 
这 样 加 可 以 仅 在 数据 被 改变 或 极 读 时 才 产 生 跟 踪 数 据 流 ， 于 是 降低 了 数据 跟 踩 所 需 的 市 宽 。 
@ 在 实现 调试 特性 时 提供 了 更 高 的 灵活 性 。 比 如 ， 人 允许 裁减 可 用 的 断 点 和 观察 点 数 ， 这 样 就 
降低 了 所 设计 产品 的 尺寸 ， 这 对 于 超 低 功 耗 的 设计 非常 有 帮助 。 
@ ”对 多 核 系 统 的 调试 ， 文 持 力 度 更 大 。 为 了 实现 多 核 同 时 重 局 和 单 步 ， 狐 增 了 一 个 接口 ( 注 
意 ， 在 程序 员 眼 中 看 不 到 这 种 改变 )。 


17.3.5 有 睡 虐 特性 


在 系统 级 设计 层 上 ， 现 有 的 睡眠 特性 也 得 到 了 改进 。 在 r2p8 中 ， 对 处 理 右 的 唤醒 可 以 延 运 ， 
从 而 使 得 在 必 上 请 中 可 以 更 大 面积 地 “停电 ” 并 且 在 系统 中 所 有 其 它 部 件 都 就 绪 后 才 继续 执行 程序 。 
这 个 改进 主要 是 为 了 照顾 下 面 一 些 应 用 : 在 它们 里 面 ， 有 一 些 便 件 在 低 功 耗 模式 下 需要 关闭 ， 但 十 
重新 打开 这 尝 便 件 需要 的 时 间 比 较 久 。 

在 睡眠 功能 的 扩展 之 外 ， 为 降低 功 耗 还 有 痢 招 。 在 旧版 的 CM3 中 ， 为 了 让 内 核能 醒 来 ， 在 睡 眼 
期 间 ， 依 然 不 能 傈 止 送 往 内 核 的 “ 目 由 运行 时 钟 ?。 尽 管 该 时 钟 消耗 的 能 量 很 低 ， 但 总 归还 是 关 了 
更 省 电 。 

为 解决 这 个 问题 ， 可 以 在 处 理 器 外 面 布设 一 个 简单 的 中 断 控制 器 。 这 个 控制 右 ， 取 名 为 “唤醒 
中 断 控制 副 (WIC)”。 在 深度 睡眠 期 间 ， 它 要 提供 在 NVIC 中 的 ,“ 中 断 掩 蔽 功能 ”的 镜像 ， 并 且 负 
责 告知 电 源 管理 系统 何 时 需要 唤醒 。 这 样 ， 就 可 以 在 深度 睡 虐 期 间 关 断 所 有 送 往 CM3 处 理 亏 的 时 钟 
了 。 

除了 可 以 停止 时 钟 外 ， 修 订 版 2 还 可 以 使 处 理 占 的 大 多 数 部 分 部 挥 电 ， 把 它们 的 状态 存储 在 厂 
干 特殊 的 逻辑 小 室 中 。 在 中 断 到 达 时 ，WIC 往 电 源 管 理 单元 〈PMU) 发 送 一 个 唤醒 请 求 。 在 处 理 璐 
重新 上 电 后 ， 先 前 的 状态 从 特殊 的 逻辑 小 宇 中 恢复 ， 然 后 就 可 以 啊 应 这 个 中 断 了 。 

可 见 ， 有 了 修订 版 2 中 这 个 新 的 掉 电 能 力 ，CM3 可 以 在 深度 睡眠 期 间 进一步 降低 功 耗 。 不 过 ， 
这 个 特性 还 需要 内 核 外 的 单元 配合 ， 因 此 不 一 定 在 所 有 修订 版 2 的 产品 中 都 文 持 。 


17.3.6 使 用 修订 版 2 带 来 的 好 处 和 注意 事项 


那么 ， 上 文 所 讲 的 这 些 新 特性 ， 叉 对 骸 入 式 产 品 开 发 市 来 了 什么 呢 ? 
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首先 ， 是 更 低 的 功 耗 和 更 从 的 电池 寿命 。 在 进入 了 有 WIC 文 持 有 的 深度 睡 虐 后 ， 整 个 电路 束 只 
很 小 一 部 分 还 在 活动 中 。 此 外 ， 在 要 求 极 低 功 耗 的 应 用 中 《如 体内 植 入 式 医疗 设备 )， 忆 户 广 商 可 
以 通过 减少 断 点 和 观 峙 点 的 数量 ， 来 裁减 心 帮 的 矿 寸 。 

第 二 ， 在 调试 和 解决 疑难 问题 的 过 程 中 ， 它 提供 了 更 好 的 灵活 性 。 不 仅 体 现在 使 用 调试 占 的 数 
据 跟 中 特性 上 ， 还 新 增 了 一 个 辅助 控制 寄存 占 。 通 过 它 我 们 可 以 给 写 绥 冲 做 个 劳 路 手术 ， 从 而 使 总 
线 faults 总 是 精确 的 。 我 们 还 可 以 使 需要 较 多 周期 才能 执行 的 指令 不 被 打 断 ， 如 LDM/STM 指令 。 
这 样 一 来 ,在 分 析 存 储 器 的 内 容 时 就 可 以 放心 了 。 最 后 ， 对 于 使 用 多 个 Cortex-M3 内 核 的 系统 ， 修 
订 版 2 带 来 的 “同时 重 局 ”和 “多 核 单 步 执行 ”的 功能 正好 雪 中 送 锋 。 除 此 之 外 ， 在 修订 上 厂 2 中 还 
有 若干 个 内 部 优化 , 以 提高 性 能 和 改善 接口 特性 。 这 样 , 局 厂 供应 商 就 可 以 设计 出 更 快 的 CM3 产品 。 

然而 ， 在 圣 受 温柔 的 同时 ， 也 请 垦 入 式 程序 员 们 留意 下 和 面 的 问题 : 


双子 扒 材 对 齐 方式 与 寞 单 堆 配 帧 


在 缺 省 情况 下 ， 异 党 堆栈 帧 会 自动 对 齐 到 双 学 存储 需 位 置 。 早 期 为 修订 和 版 8/1 与 的 汇编 程序 ， 
如 果 要 通过 堆栈 来 把 数据 传送 给 异常 服务 程序 ， 可 能 会 受到 影响 。 为 了 准确 判定 堆栈 帧 的 起 始 
位 置 是 否 往 下 挪移 了 一 个 字 , 异常 服务 例 程 要 先 读 取 入 栈 PSR 的 比特 9。 如 果 不 想 动 旧 的 程序 ， 
也 可 以 手工 把 STKALIGN 比特 清除 ， 这 样 束 与 以 前 的 一 样 了 。 与 EABI 标准 兼容 的 应 用 程序 不 
会 受 影响 。 这 些 程序 通常 是 5 程序 ， 并 日 使 用 与 EABI 兼容 的 编译 项 编译 。 


sysTick 定时 器 也 许 会 在 深度 睡眠 期 间 俘 止 。 


如 果 使 用 的 CM3 单片机 确实 包含 了 掉 电 功能 ， 或 者 是 其 它 原 因 使 得 送 往 内 核 的 时 钟 全 体 都 在 深 
度 睡 眠 中 停止 ， 则 sysTick 定时 器 在 深度 睡眠 期 间 就 无 法 再 运行 。 这 样 一 来 ， 使 用 了 RToOS 的 
杠 入 式 应 用 程序 就 需要 一 个 外 部 时 钟 ， 用 它 来 在 唤醒 时 提供 调度 所 需 的 滴答 信号 。 


当 处 理 器 连接 到 一 个 调试 器 时 ， 会 目 动 除 能 新 的 挥 电 功 能 。 


这 是 因为 调试 带 需 要 访问 处 理 亏 的 调试 相关 寄存 右 。 在 调试 会 话 中 ， 能 够 控制 内 核 停机 或 进入 
睡眠 模式 ， 但 哪怕 使 能 了 挥 电 功 能 ， 也 不 会 触 用 把 电 序列 。 为 了 准确 地 测试 折 电 操作 时 的 功 耗 ， 必 
须 解除 被 测 设备 与 调试 带 有 的 连接 。 




























































































17.4 开发 工具 


在 开始 使 用 Cortex-M3 之 前 ， 需 要 准备 好 一 些 开发 工具 ， 典 型 的 如 : 

@ 编译 右 / 汇 编 右 : 把 C 和 汇编 源 程序 转换 成 目标 文件 。 儿 乎 所 有 的 C 编译 右 僚 件 都 包含 了 
对 应 的 汇编 器 。 

@ 指令 系统 模拟 器 : 模拟 指令 的 执行 ， 用 于 在 软件 开 友 早期 的 调试 。 

@ 在 线 仿真 器 (ICE) 或 者 调试 探测 器 (probe ): 连接 到 电脑 和 目标 板 上 的 调试 硬件 ， 与 目 
标 板 的 接口 通常 是 JTAG 或 SW。 

@ 一 块 开发 板 。 

@ 跟踪 捕捉 仪 : 可 选 的 硬件 设备 和 周边 软件 ， 可 以 用 它 来 捕捉 来 日 DWT 以 及 ITM 的 输出 ， 并 
且 以 可 读 的 形式 显示 出 来 。 

@ 仍 入 式 操 作 系统 : 在 单片机 上 运行 的 操作 系统 。 这 也 是 一 个 可 选 件 ， 许 多 简单 的 应 用 程序 
不 需要 操作 系统 。 但 是 在 开发 复杂 上 度 较 高 或 者 有 高 性 能 指标 的 系统 时 ， 常 常 需要 使 用 。 
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17.4.1 C 编译 器 


截止 到 目前 ， 己 经 有 寿 干 个 C 编译 项 套件 可 以 使 用 了 ， 如 表 17.3 所 列 。 
表 17.3 支持 Cortex-M3 的 开发 工具 











公司 产品 
ARM Cortex-M3 在 RealView 开发 依 件 3.6(RVDS ) 中 得 到 文 持 。 在 
www .arm.com RealView-ICE 1.5 可 以 用 于 连接 调试 便 件 和 调试 环境 。 更 早 的 


ADS1.2 和 SDT 不 文 持 Cortex-M3 
KEIL(an ARM company) 大 名 易 易 的 KEIL， 一 度 在 8651 的 开发 中 享有 盛誉 。 在 其 最 新 的 














Www . Kkeil .com Realview MDK 开发 工具 中 ， 支 持 了 Cortrex-M3， 其 配套 的 仿真 
器 是 ULINK 和 ULINK2。 
CodeSourcery 支持 Cortex-M3 的 GNU 工 具 链 现在 已 经 可 用 了 ， 下 载 地 址 


www.codesourcery .com 是 www.codesourcery .com/gnu toolchalns/arm。 
它 基 于 GNU 4.6 版 本 





Rowley Associates 这 个 工具 也 源 日 GNU C 编译 器 

www .rowley.co.uk www.rowley.co.uk/arm/index.htm 

IAR Systems IAR Embedded Workbench for ARM and Cortex， 它 提供 了 

Www. iar .com C/C++ 编译 器 和 调试 环境 (从 4.46 版 本 开始 )。IAR 在 早 在 AVR 
单片机 的 开发 中 整 是 出 类 拔 蔡 的 。 与 IAR 配套 的 仿真 占 是 JLINK 

Lauterbach 提供 了 JTAG 访 丰 器 和 跟 躁 设备 

www .lauterbach.com 


17.4.2 内 入 式 操 作 系 统 文 持 


FEF 档次 应 用 程序 常常 需要 0S， 尤 其 是 RTOS。 许 多 0S 已经 被 开发 出 来 用 于 艇 入 式 产品 ， 目 前 ， 
支持 Cortex-M3 的 0S 如 表 17.4 所 列 : 








244 


Cortex-M3 权威 指南 第 17 章 





表 17.4 支持 Cortex-M3 的 先入 式 操作 系统 


公司 产品 

FreeRTOS FreeRTOS 
www.freertos.org 

Express Logic ThreadX™ RTOS 
www.expresslogic.com 
Micrium uC/OS-II 
www .micrium.com 
Accelerated Technology Nucleus 
www.acceleratedtechnology .com 

Pumpkin Inc. Salvo RTOS 
www .pumpkininc.com 
CMX Systems CMX -RTX 
WwW. CmMX .com 

KEIL ARTX-ARM 
www. Keil.com 
Segger embOs 
Www. Segger .com 

IAR Systems IAR PowerPac for ARM 
ww .iar.com 
T-Engine 论坛 uT-Kernel 


www.t-engine.org 
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ARM7 应 用 程序 移 楂 到 Cortex-M3 


简介 

系统 个 性 
汇编 源 程序 

C 源 程序 

预 编译 的 目标 文件 
优化 


18.1 从 介 


如 果 非 要 找 出 CM3 的 降临 可 以 带 来 的 痛苦 ， 也 许 就 是 把 运行 在 ARM7TDMI 上 的 代码 升级 过 来 所 
要 做 的 工作 了 ， 这 种 成 长 的 阵痛 也 是 在 所 难免 的 。 为 了 降低 升级 难度 专门 开 出 本 章 ， 把 升级 过 程 中 
的 重点 明确 地 总 结 一 下 。 

在 计划 把 代码 从 ARM7 移植 到 CM3 时 ， 需 要 考虑 以 下 的 方面 : 
系统 性 质 
汇编 源 程 序 
C 源 程 序 
优化 

总 体 来 说 ， 越 是 底层 的 代码 ， 受 到 的 冲击 越 大 。 像 最 底层 的 硬件 控制 、 任 务 管理 以 及 异常 服务 
例 程 ， 它 们 与 架构 的 关系 最 密切 。 另 一 方面 ， 因 为 底层 的 代码 往往 大 面积 地 使 用 汇编 ， 因 此 面临 改 
写 其 至 重 写 的 工作 量 最 大 。 普 通 的 应 用 程序 需要 的 改动 则 比较 小 ， 而 且 这 时 优良 的 编程 习惯 经 稼 会 
大 幅度 ， 甚 至 戏剧 般 地 降低 修改 工作 量 〈 最 简单 的 束 是 多 使 用 宏 定 义 )。 对 于 与 架构 无 关 的 纯 算 法 
类 应 用 程序 ， 则 都 无 需 改动 ， 只 要 人 简单 地 重新 编译 即 可 。 


18.2 系统 的 个 性 


想必 大 家 也 已 经 总 络 出 来 了 ，CM3 与 ARM7 相 比 ， 还 是 有 很 多 狐 的 个 性 的 。 像 固定 的 存储 句 映 
射 ， 中 断 处 理 机 制 ， 操 作 模式 ， 系 统 控制 ， 以 及 新 引入 了 MPU 每。 下 面 我 们 整 一 一 小 结 。 


18.2.1 和 存储 器 映射 


在 不 同 处 理 亏 架构 间 的 差异 中 ， 存 储 表 有 映射 算得 上 十 最 “外 癌 ” 型 的 了 。 在 ARM7 中 ， 是 由 亏 
件 广 商 目 由 划分 4GB 的 寻 址 空间 的 ， 再 加 上 广 商 还 可 能 玩 各 种 “二 次 映射 ” 拉 术 ， 各 ARM 心 厂 之 间 
的 存储 磊 映 射 可 以 是 大 相 径 寿 的 。 到 了 CM3 中 ， 把 存储 顺 映 射 被 粗 线条 地 标准 化 了 一 一 把 4GB 空间 
分 成 了 才干 个 不 同类 型 的 区 域 ， 对 应 的 存储 器 必须 对 号 入 座 。 一 般 地 ， 通 过 设置 编译 和 连接 选项 ， 
可 以 轻易 地 适应 新 的 ROM 和 RAM 的 映射 岁 。 但 对 于 设备 张 动 程序 ， 则 情况 比较 复杂 。 如 是 不 同 广 
家 的 心 厂 ， 外 设 寄存 占 的 用 法 基本 上 是 完全 不 同 的 ， 此 时 驱动 程序 必须 重 写 ; 如 末 是 在 同一 厂家 的 
ARM7 和 CM3 芯片 间 移 植 ， 则 外 设 寄存 器 有 望 相对 一 致 ， 驱 动 程序 只 需 部 分 改动 ， 甚 至 简单 到 只 修 
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改 基地 址 即 可 。 

许多 ARM7 心 片 会 提供 存储 器 的 “二 次 映射 ”功能 ， 其 中 一 个 重要 的 用 途 ， 吏 是 使 问 量 表 可 以 
被 重 映 射 到 SRAM 中 。 而 在 CM3 中 ， 可 以 通过 编程 NVIC 的 寄存 器 来 实现 此 功能 ， 因 此 不 再 需要 这 
些 二 次 映射 功能 ， 从 而 许多 心 族 可 能 也 去 反 了 完备 的 二 次 映射 文 持 “〈 但 是 可 能 会 提供 一 种 “硬件 控 
制 ” 的 二 次 区 射 一 一 上 电 时 ， 由 某 些 管 脚 的 电 平 决 定 把 哪里 的 存储 堪 映 射 到 零 地 址 上， 以 文 持 多 种 
引导 方式 。 如 STM32 就 采用 了 此 法 ， 以 支持 从 Flash/SRAM/ 原配 BootLoader 引导 一 一 译 者 注 )。 

CM3 对 大 端 模式 的 文 持 方 式 也 与 ARM7 的 不 一 样 。 程 序 代 但 上 只 需 重 新 编 诺 ， 但 是 事先 做 好 的 得 
找 表 则 需要 重新 编码 。( 大 问 编 码 是 多 事 之 地 ， 建 议 谈 者 少 健 它 一 一 译 者 注 )。 

从 ARM726T， 以 及 ARM9 等 那个 年 代 开 始 的 处 理 吉 ， 为 了 文 持 像 WinCE 这 样 的 操作 系统 ， 引 入 
了 所 谓 的 “电站 问 量 ” 功 能 一 一 允许 把 问 量 表 草 定位 到 6xFFFF_8888。CM3 并 没有 打算 文 持 WinCE 
(实际 上 最 重要 的 原因 是 没有 配 MMU)， 因 此 去 掉 了 “高 端 向 量 ” 的 支持 。 


18.2.2 中断/ 异常 系统 


可 能 NVIC 都 快 引 起 大 家 的 审美 疲劳 了 。 没 错 ， 在 CM3 中 的 中 断 处 理 已 经 被 彻底 改造 ， 因 此 所 
有 与 控制 中 断 有 关 的 代码 都 需要 大 面积 更 新 。 而 且 还 需要 为 建立 中 断 优 先 级 和 向 量 表 添 加 全 新 的 代 
码 。 

中 断 返 回 机 制 也 变 了 。 这 影响 到 了 汇编 代码 。 而 且 如 果 编 译 器 使 用 指示 字 (directive) 来 文 持 
C 程序 中 断 服 务 程序 的 话 ， 还 需要 调整 指示 字 。 

过 去 ， 对 中 断 的 使 能 和 除 能 是 通过 修改 CPSR 的 ， 在 CM3 中 没有 CPSR， 而 是 使 用 PRIMASK 或 
FAULTMASK 来 实现 全 局 中 断 的 开关 。 

CM3 在 响应 中 汤 时 ， 启 用 了 一 个 目 动 栈 操作 的 机 制 ， 因 此 可 以 把 旧时 的 入 栈 和 出 栈 指令 化 人 简 。 
然而 ,旧时 的 ARM 还 有 所 谓 的 FIQ, 并且 为 FIQ 服 务 例 程 专 开 了 小 灶 一 一 独立 的 4 个 案 存 器 (R8-R11)， 
专 为 FIQ 服务 例 程 使 用 ， 无 需 push/pop。FIQ 其 实 极 少 利用 ， 成 了 “彩色 糖衣 包装 却 没 营 养 的 药 
药 ”。 在 CM3 中 并 没有 FIQ 的 概念 ， 因 此 在 移植 以 前 的 FIQ 服务 例 程 时 ， 在 代码 上 必须 把 它 当 作 普 
通 的 中 断 服务 例 程 处 理 一 一 其 实 因为 CM3 有 目 动 堆栈 操作 , 普通 中 断 也 相当 于 享有 FIQ 的 小 灶 符 遇 。 
另 一 方面 ， 通 过 提升 其 优先 级 到 最 高 ， 可 以 使 它 在 时 间 上 得 到 FIQ 的 符 遇 。 

实现 和 藤 套 中 断 的 代码 现在 可 以 去 掉 了 ， 因 为 CM3 的 NVIC 已 经 内 部 实现 了 中 断 风 套 。 

错误 处 理 机 制 也 大 有 不 同 。 旧 时 的 ARM 只 有 DAbt，IAbt，Undef 这 3 种 异常 模式 对 应 错误 处 
理 , 而 到 了 CM3 中 ,提供 了 很 多 fault 状态 寄存 器 来 确定 各 种 faults, 而 有 旦 还 定义 了 许多 新 的 fault 
类 型 ， 其 中 最 有 新 意 的 束 是 堆栈 操作 faults、 存 储 器 管理 faults 以 及 便 fault 了 。 因 此 , fault 
服务 例 程 需要 重新 设计 。 





































































































18.2.3 MPU 
MPU 是 CM3 中 的 新 鲜血 液 ， 因 此 需要 新 的 程序 代码 来 使 用 它 。 妃 一 方面 ， 因 为 在 ARM7TDMI 中 


没有 MPU， 因 此 这 方面 没有 “代码 移植 ”的 概念 。 不 过 ， 在 ARM726T 上 是 配 有 MMU 的 ， 它 的 功能 与 
CM3 的 MPU 不 一 样 一 一 事实 上 ， 如 果 代 码 需 要 MMU 来 支持 虚拟 内 存 ， 根 本 就 不 能 使 用 CM3。 


18.2.4 系统 控制 


系统 控制 也 是 移植 程序 时 必须 充分 重视 的 关键 内 容 。CM3 内 建 了 进入 睡 虐 模 式 的 指令 。 丸 一方 
面 ， 在 CM3 必 记 中 的 系统 控制 戎 也 有 特殊 的 设计 要 求 ， 基 本 上 它们 不 会 与 ARM7 心 片 中 的 有 什么 相 
似 乙 处 。 因 此 ， 要 做 好 思想 准备 ， 来 重 写 系 统 控 制 相关 的 代码 。 
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18.2.5 操作 模式 


以 前 的 ARM 架构 有 7 种 操作 模式 , 在 CM3 中 , 它们 可 以 用 对 应 的 异常 来 取代 , 如 表 18 .1 所 示 : 


表 8.1 把 ARM7TDMI 中 的 操作 模式 和 异常 映射 到 CM3 


在 ARM7 中 的 操作 模式 和 异常 在 CM3 i 人 


外 部 中 断 - 


区 所 流产 (DAbt) 
系统 模式 竺 权 级 的 ne 


虽然 在 CM3 中 ， 可 以 把 ARM7 的 FIQ 对 应 到 优先 级 最 高 的 外 中 上 从 而 实现 FIQ 的 时 间 地 位 。 
但 是 ARM7 的 “专用 寄存 器 ”是 R8-R11， 而 CM3 自动 入 栈 的 寄存 器 是 R@-R3,R12。 因 此 ， 旧 时 FIQ 
服务 例 程 需要 改 用 Re-R3,R12; 如 果 依 然 要 使 用 R8-R11， 就 必须 和 完 把 它们 手工 入 栈 。 


“A 


能 有 不 少 人 曾 想 到 过 用 NMI 来 取代 FIQ。 的 确 ， 在 一 些 场 1 
是 ，NMI 与 FIQ 有 本 质 的 区 别 ， 使 得 很 多 情况 下 它 能 9 换 ， 这 也 是 我 1 








胃 | 晶 
四 FIQ 是 除 能 的 ， 有 /i | 
\ 得 使 用 SVC， 而 ARM7 的 FIQ 服务 例 程 则 可 以 使 用 SWI。 
:在 FIQ 服务 例 程 的 执行 过 程 中 ,， 也 可 以 转 而 响应 其 它 
SEE 如 采 NMI 服务 例 程 执行 过 程 中 发 生 fault， 则 





18.3 汇编 源 程序 
对 汇编 源 程序 的 移植 取决 于 使 用 的 是 ARM 状态 还 是 Thumb 状态 。 


18.3.1 Thumb 状态 


如 果 使 用 的 是 thumb 汇编 源 文件 ， 则 是 幸运 的 ， 在 大 多 数 情 况 下 代码 可 以 直接 拿 来 用 。 只 有 个 
别 的 thumb 指令 在 CM3 中 不 可 用 : 

@ 任何 试图 转 入 ARM 状态 的 指令 (典型 就 是 BLX) 

@ 不 再 支持 SWI， 而 是 要 使 用 SVC， 而 且 用 法 上 也 有 区 别 

最 后 ， 一 定 要 只 使 用 向 下 生长 的 满 栈 ，CM3 的 push 和 pop 就 是 使 用 这 种 模型 的 一 一 总 有 程序 
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袁 欢 玩 为 类 ， 结 果 不 但 移植 工作 量 加 重 了 ， 也 无 法 使 用 C 语言 了 。 因 此 可 别 在 这 里 筋 “叛逆 精神 ” 
啊 ， 硅 则 会 目 找 百 吃 的 ， 而 且 癌 下 生长 的 满 栈 本 来 束 是 更 合理 的 。 














18.3.2 ARM 状态 
如 果 不 幸 在 汇编 源 文件 中 使 用 了 ARM 状态 ， 也 不 要 慌 ， 仔 细 核 对 下 列 情 况 ; 





器 量 表 : 在 ARM7 中 ， 问 量 表 从 8 地 址 开始 ， 并 且 由 一 系列 的 跳 转 指令 组 成 。 在 CM3 中 ， 
跳 转 表 给 出 了 MSP 的 初 值 以 及 复位 向 量 地 址 ， 接 下 来 的 则 是 各 异常 服务 例 程 的 入 口 地 址 。 
因此 这 些 区 别 是 本 质 上 的 不 同 ， 辐 量 表 必 须 重 写 。 

寄存 器 初始 化 : 在 ARM7 中 ， 经 稼 需要 把 每 个 模式 下 的 寄存 器 分 别 初始 化 。 比 如 ， 每 个 模 
式 〈 除 系统 模式 外 ) 都 有 自己 的 SP、LR 和 SPSR。CM3 去 掉 了 这 些 繁 文 缠 节 ， 而 且 也 不 再 
涯 要 把 处 理 费 的 模式 换 来 换 去 。 

模式 切换 与 状态 切换 : 在 CM3 不 再 保留 ARM7 中 的 那些 操作 模式 ， 也 没有 Thumb 状态 ， 
此 相关 的 代码 都 可 以 移 除 。 

中 断 的 使 能 与 除 能 : 在 ARM7 中 ， 中 断 的 使 能 与 除 能 是 通过 对 CPSR.I 来 控制 的 。 在 CM3 
中 则 改 用 PRIMASK 或 FAULTMASK。 更 进一步 地 ，CM3 中 没有 FIQ 的 概念 ， 因 此 也 没有 FF 
位 。 

协 处 理 右 访问 : CM3 不 支持 协 处 理 器 ， 因 此 相关 的 代码 无 法 移植 。 但 是 可 以 通过 软件 模拟 
的 办 法 来 缓解 

中 断 服 务 例 程 和 中 断 返 回 : 在 ARM7 中 ,中断 服务 例 程 的 首 条 指令 在 问 量 表 中 。 这 条 指令 ， 
除了 FIQ 服务 例 程 的 外 ， 都 必须 是 一 种 无 条 件 跳 转 指令 ， 而 CM3 中 则 是 直接 在 癌 量 表 中 给 
出 ISR 的 入 口 地 址 。 中 断 返 回 时 ,ARM7 是 通过 带 s 后 级 的 指令 手工 地 调整 PC 的 值 来 实现 ; 
而 CM3 则 把 需要 返回 的 地 址 压 入 堆栈 中 ， 并 且 通 过 把 某 个 EXC_RETURN 写 入 PC 来 触发 中 
断 返 回 序列 。 因 此 ,在 CM3 中 , 不 得 使 用 诸如 MOVS 或 SUBS 之 类 的 指令 来 启动 中 断 返 回 。 
由 于 这 些 原 因 ， 中 断 服务 例 程 和 中 断 返 回 的 代码 需要 加 以 改动 。 

当 需 要 启用 中 断 航 套 时 ，ARM7 的 作法 通常 是 先进 入 系统 模式 再 重新 使 能 IRQ， 在 CM3 中 
则 没有 这 些 操作 。 

FIQ 服务 例 程 : 因为 在 ARM7 中 ,FIQ 有 专用 的 R8-R12; 而 CM3 则 目 动 保存 了 R@-R3, R12。 
所 以 如 果 必 须要 移植 FIQ 服务 例 程 ， 则 需要 手工 保存 R8-R11。 或 者 把 本 来 对 R8-R11 的 
使 用 ， 改 为 以 R@-R3 的 使 用 。 

软件 中 断 (SNI) 服 务 例 程 : SNI 由 SVC 取代 。 不 过 ， 定 位 软件 中 断 指令 并 萃取 系统 调用 号 
的 作法 不 同 。 在 CM3 中 , 通过 压 入 栈 的 返回 地 址 来 计算 出 SVC 指令 的 地 址 ; 而 在 ARM7 中 ， 
则 是 通过 LR 来 计算 。 

交换 指令 (SWP): 在 CM3 中 没有 交换 指令 。 如 果 以 前 使 用 SWP 来 实现 信号 量 ， 则 要 改 为 使 
用 互 斥 访问 来 实现 ， 因 此 需要 改动 信号 量 相 关 的 代码 。 如 果 以 前 使 用 SWP 只 是 为 了 纯粹 地 
传送 数据 ， 则 需要 使 用 在 干 存储 器 访问 指令 来 实现 。 

对 CPSR 和 SPSR 的 访问 : ARM7 中 的 CPSR 在 CM3 变 成 了 xPSR， 而 SPSR 则 被 去 挥 了 。 对 
于 访问 标志 的 应 用 程序 代码 ， 可 以 改 为 对 APSR 的 访问 。 如 果 异 常服 务 例 程 想 要 访问 异常 
发 生 之 前 的 xPSR, 则 要 读 取 压 入 堆栈 中 的 值 一 一 这 取代 了 ARM7 中 SPSR 的 功能 , 因此 CM3 
中 不 再 需要 SPSR。 

条 件 执行 : 在 ARM7 中 ， 大 量 指令 都 可 以 条 件 执行 ;而 Thumb-2 的 指令 则 几乎 都 不 能 条 件 
执行 。 在 移植 这 些 代码 到 CM3 中 时 ， 对 于 短小 的 条 件 执行 段 ， 可 以 用 IF-THEN 指令 封装 ; 
而 比较 大 的 则 需要 使 用 跳 转 指令 来 改建 。 当 使 用 IT 指令 时 要 注意 一 些小 问题 。 主 要 束 是 
会 增加 代码 量 ， 有 可 能 使 得 某 些 加 载 /存储 指令 超出 最 大 可 操作 的 地 址 郊 围 。 

使 用 PC 计算 当前 代码 的 地 址 ， 在 ARM7 中 ， 读 取 的 PC 值 “ 读 PC 指令 的 地 址 +8” 这 是 由 


250 








































































































Cortex-M3 权威 指南 第 18 章 


ARM7 的 三 级 流水 线 造 成 的 一 一 当 读 取 PC 的 指令 处 于 执行 阶段 时 ，PC 已 经 自 增 了 两 次 。 同 
样 的 事情 也 发 生 在 CM3 中 , 但 是 在 代码 移植 到 CM3 后 , 因为 这 些 代 码 将 在 Thumb 下 执行 ， 
所 以 PC 被 加 的 值 变 成 4。 

@ 对 R13 的 使 用 : R13 总 是 32 位 的 。 但 是 在 CM3 中 ， 末 2 位 被 强制 为 6。 因 此 ， 如 果 侦 尔 
过 到 使 用 R13 作为 基 址 的 场合 (强烈 反对 使 用 )， 必 须 更 改 代码 ， 因 为 末 2 位 的 信息 已 经 
Rs 


18.4 C 着 程序 


可 。 





好 瓯 也 是 高 级 语言 ， 移 植 C 源 程序 要 比 移植 汇编 的 轻松 很 多 。 在 许多 情况 下 ， 只 消 重 新 编译 即 

但 是 对 于 使 用 了 非 主流 技 巧 的 C 程 序 ( 常 见于 系统 程序 中 )， 则 可 能 要 考虑 如 下 的 方面 。 

@ 内 联 汇编 : 如果 使 用 RVDS， 则 不 支持 内 联 汇 编 ， 因 此 使 用 了 内 联 汇编 的 C 程序 需要 做 出 
修改 。 对 于 RVDS 3.6 及 更 蜗 版 本 ， 可 以 使 用 移入 式 汇编 来 蔡 代 内 联 汇编 。 

@ 中断 服 务 例 程 :对 于 使 用 “″_ irq” 来 创建 的 ARM7 中 断 服 务 例 程 ， 因 为 CM3 使 用 了 新 的 
中 断 模 型 ， 往 往 可 以 去 掉 “ irq” 指 示 字 (不 过 ， 如 果 使 用 RVDS 3.6 和 RVCT 3.6， 则 
irq 也 支持 CM3， 此 时 可 以 保留 “ irq” 以 强调 程序 的 类 型 ， 提 高 了 可 读 性 )。 














18.5 预 编译 的 目标 文件 








许多 编 详 融和 都 为 函数 库 和 局 动 代码 预先 编 详 出 了 目标 文件 。 但 是 因为 操作 模式 和 状态 模型 的 不 


同 ， 它 们 往往 不 能 用 在 CM3 上 一 一 尤其 是 局 动 代码 。 此 时 ， 丈 必须 得 到 它们 的 源 代 人 码 ， 并 且 移 植 到 
CM3 上 ， 请 参阅 你 所 使 用 工具 链 的 联机 帮助 来 获取 详细 信息 ‘事实 上 ， 推 荐 使 用 的 开 友 工具 


(KeilMDK/GCC) 都 已 经 做 好 了 这 些 事 情 





详 者 注 ) oO 


18.6 优化 








CM3 中 有 许多 独特 性, 加 以 利用 的 话 第 币 可 以 大 大 提高 程序 的 性 能 , 或 者 降低 对 存储 硕 的 使 用 。 








对 于 积极 癌 上 的 我 们 ， 一 定 要 挖 据 这 些 特 性 : 


使 用 32 位 Thumb- 2 指令 : 对 于 下 列 的 场合 : 先 使 用 一 条 16 位 thumb 指令 把 数据 从 一 个 寄 


存 器 传送 到 另 一 个 ， 再 对 该 数据 执行 数据 处 理 。 有 时 能 使 用 一 条 Thumb-2 指令 来 完成 (这 主要 
是 因为 16 位 Thumb 指令 不 能 使 用 “高 寄存 器 ”一 一 译 者 注 )， 从 而 使 所 需 的 处 理 时 间 缩 短 。 


位 带 操 作 : 如 果 外 设 寄存 器 位 于 位 带 区 ， 则 可 以 通过 对 位 带 别 名 区 的 访问 ， 大 大 地 化 简 对 寄 

存 器 位 的 操作 。 

乘法 与 除法 : cM3 的 一 个 重大 革新 就 是 支持 除法 指令 和 部 分 支持 64 位 乘法 指令 。 请 善 用 它们 
(尤其 是 除法 )， 可 以 成 十 上 百倍 地 提高 程序 的 执行 速度 。 

V 即 数 : 有 些 Thumb-2 指令 支持 长 达 12 位 的 立即 数 ， 因 此 可 以 把 以 前 Thumb 指令 无 法 加 载 

的 立即 数 使 用 一 条 Thumb-2 来 加 载 。 

跳 转 : 过 去 单条 Thumb 指令 无 法 执行 的 远程 跳 转 ， 现 在 可 以 使 用 Thumb-2 指令 实现 了 。 
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e@ 布尔 数据 : 对 于 “BO0L” 型 的 变量 ， 可 以 强制 把 它们 定 址 到 内 存 的 位 带 别 名 区 。 相 比 于 过 去 
使 用 字 来 实现 BOOL 变量 ， 现 在 上 只 需 使 用 以 前 1/32 的 内 存 空间 。 

@ IT 指令 块 : 有 些 短 距 跳 转 可 以 使 用 IT 指令 取代 ， 这 样 做 消灭 了 因 流 水 线 清洗 而 引入 的 等 待 
周期 ， 从 而 提高 了 性 能 。 

e@ ARM/Thumb 状态 切换 : 在 大 多 情况 下 ， 可 以 把 大 部 分 代码 以 Thumb 指令 编码 ， 一 小 部 分 以 


ARM 指令 编码 。 这 主要 是 为 了 在 平时 提高 代码 密度 ， 而 在 紧急 关头 下 提高 性 能 。 在 CM3 下 有 了 
Thumb-2 代码 ， 可 以 在 同一 模式 下 解决 时 间 与 空间 的 权衡 。 这 就 可 以 去 掉 这 些 状 态 转 换 及 其 所 
带 来 的 额外 负担 (overhead)， 也 简化 了 对 工程 的 管理 。 
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使 用 GNU 工具 链 开 始 Cortex-M3 开 友 


车 放 世 到 拓 
月 拯 


获取 GNU 工具 链 

开发 流程 

示例 程序 
访问 特殊 功能 寄存 器 
使 用 未 文 持 的 指令 

GNU C 编译 需 的 内 联 汇编 


19.1 背景 








GNU 工具 链 在 ARM 产品 开发 中 使 用 得 很 广泛 , 并 且 有 些 为 ARM 打造 的 开发 工具 也 是 基于 GNU 工 
具 链 的 。 在 目前， 文 持 CM3 的 GNU 工具 链 可 以 由 CodeSourcery 处 免费 下 载 到 
(www.codesourcery.com)。 而 GNU 的 主打 C 编译 器 则 在 以 后 支持 CM3 (在 2668 年 3 月 31 日 以 
后 ， 主 流 的 GNU 工具 链 已 经 支持 Cortex-M3， 对 应 的 开发 工具 为 WinARM 一 一 译 者 注 )。 

本 章 只 介绍 使 用 GNU 工具 链 的 基础 知识 ， 更 详细 的 信息 还 需要 参阅 联机 帮助 文档 。 值 得 一 提 的 
是 ，GNU 的 汇编 语法 (GNU 工具 链 中 的 As 程序 ) 与 ARM 的 汇编 语法 是 有 些 不 同 的 。 这 些 不 同 点 包 
括 变 量 定义 、 编 译 指 示 字 、 以 及 the 1ike。 因 此 ， 使 用 ARM RealView 工具 的 汇编 代码 在 使 用 GNU 
工具 前 ， 还 需要 一 些 (很 枯燥 的 ) 修改 工作 。 




















19.2 获取 GNU 工具 链 


编译 好 的 GNU 工 具 链 可 以 从 www.codesourcery.com/gnu toolchains/arm/ 处 下 载 。 有 一 系 
列 的 和 二进制 构建 版 本 。 对 于 最 人 简单 的 使 用 ， 可 以 使 用 EABI[ 注 ， 并 旦 不 融 租 入 式 05 文 持 的 版 本 。 这 
个 工具 链 既 有 在 Nindows 上 使 用 的 版 本 ， 也 有 在 Linux 上 使 用 的 版 本 。 本 章 给 出 的 示例 程序 可 以 用 
于 任何 一 个 版 本 上 。 
注 (EABI 表示 髋 入 式 应 用 程序 二 进 制 接口 。 可 执行 目标 文件 必须 得 合 访 规格， 从 而 可 以 跨 开 发 工 
其 集 使 用 ) 


19.2.1 开发 流程 


和 ARM 开发 工具 的 相似 ，GNU 工具 链 也 包含 了 编译 器 、 汇 编 器 和 连接 器 ， 从 而 使 得 源 代码 既 可 
以 使 用 C， 也 可 以 使 用 汇编 写成 ， 如 图 19 .1 所 示 。 
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C 源 文件 (.C) 目标 文件 (.o) 
Wl GCC ml 上 
一 王 | 也 
( 编译 器 ) 映像 (bin) 
可 执行 的 
存储 器 连接 映像 文件 objcopy 
布局 对 LD 
ons ) 
objdump 
汇编 源 文 件 (.s) 站 o) 
反 ; > -txt) 
AS 
(汇编 避 ) 


19.1 基于 GNU 工具 链 的 开 友 流程 模式 图 


不 同 的 应 用 程序 环境 中 也 有 不 同 版 本 的 工具 链 (Symbian，Linux，EABI 等 )。 取 决 于 工具 链 
的 目标 平台 ， 相 应 的 可 执行 文件 通常 有 一 个 前 绥 。 例 如 ， 如 果 使 用 了 EABI 环境 ， 则 GCC 命令 为 
ed 本 章 的 目标 代码 使 用 CodeSourcery 的 GNU ARM 工具 链 ， 如 表 19.1 所 示 。 
表 19.1 winARM26986331 GNU 工具 链 的 命令 名 称 

















功能 命令 

汇编 名 arm-none-eabi-as 

编译 器 arm-none-eabi-gcc 

J arm-none-eabi-1d 

二 进 制 映 像 产 生 右 arm-none-eabi-objcopy 
反 汇 编 器 arm-none-eabi-objdump 


在 开发 流程 图 中 ， 连 接 脚 本 是 可 选 鸭 。 但 是 当 存储 需 映 射 比 较 复 杂 时 ， 第 币 是 必需 的 。 


19.3 示例 程序 
让 我 们 开 开 腿 ， 看 一 看 GNU 工具 链 下 的 源 代 码 的 众生 相 。 


19.3.1 例 1: 第 一 个 程序 


作为 局 过 ,让 我 们 把 在 第 16 章 引 入 的 人 简单 程序 使 用 GCC 重 与 一 遇 。 这 个 程序 计算 19+9+8+...+1 
的 值 ， 如 下 所 示 : 
二 二 二 二 二 二 二 二 = 二 examplel.s ========== 
/* 定义 常数 */ 

.edu STACK_TOP, Ox20000800 





.text 

.global _start 

.Code 16 

.Syntax unified 

A ,thumbfiune */ 

/ * .thumbfunc 仪 仪 在 200683-26 之 前 的 CodeSourcery 工 具 中 需要 */ 


_start: 
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.Word STACK TOP, start 
“type starty .funct Lon 


2 AND 


start: 
movs FO: #10 
movs Bs #0 


/* 计算 10 二 9+8.. .+1 */ 


Joop : 
adds a ro0 
subs 0 #1 
bne loop 


/* Result is now in R1 */ 
deadloop: 
b deadloop 


一 一 一 一 一 一 一 一 一 一 end of file 三 三 三 一 一 一 一 一 一 一 

.word 指示 字 定 义 MSP 起 始 值 为 9x2666 8869， 并 且 把 ”start2> 作 为 复位 向 量 。 
.text 也 是 一 个 预定 义 的 指示 学 ， 表 示 从 这 以 后 是 一 个 代码 区 ， 需 要 了 予以 汇编 。 
.global 使 _start 标号 可 以 由 其 它 目 标 文 件 使 用 。 

.code 16 指示 程序 代码 使 用 thumb 写成 。 

.Syntax unified 指示 使 用 了 统一 汇编 语言 语法 。 

_start 是 一 个 标号 ， 指 示 出 程序 区 的 入 口 点 

start 是 为 一 个 标 写 ， 它 指示 复位 问 量 。 

.type start，function 宣告 了 start 是 一 个 疯 数 。 对 于 所 有 处 于 同 量 表 中 的 异常 问 量 ， 这 
种 宣告 都 是 必要 的 ， 耕 则 汇编 占 会 把 问 量 的 LSB 清 零 一 这 在 thumb 中 是 不 允许 的 。 
@ .end 指示 程序 文件 的 结束 。 

与 ARM 汇编 占 不 同 的 是 ，GNU 汇编 右 中 的 标 亏 要 以 “: ”结尾 : 注释 可 以 使 用 /* 和 */， 并 且 指 
不 了 要 以 -702 作为 朋 和 用。 

要 注意 : 在 thumb 代码 ( .code 16) 里 面 ， 复 位 同 量 〈(start) 被 定义 成 了 一 个 函数 (.type 
start，function)。 这 是 为 了 使 复位 向 量 的 LSB 被 强制 为 1， 从 而 表示 这 是 以 Thumb 状态 开始 执 
行 。 否 则 ， 处 理 器 就 会 尝试 以 ARM 态 开始 ， 从 而 引起 一 个 硬 fault。 

程序 写 好 后 ， 使 用 as 来 汇编 这 个 源 程序 ， 命 令 格式 为 : 
$5> arm-none-eabi-as -mcpu=cortex-m3 -mthumb examplel.s -Oo examplel.o 

执行 了 这 个 命令 ， 就 产生 了 目标 文件 example1.o。 命 令 行 中 的 -mcpu 和 -mthumb 决定 使 用 的 
指令 集 。 接 下 来 执行 连接 ， 命 令 如 下 
> arm-none-eabli= ld =Ttext 0x0. =o Examnplel. out examplel,o 

然后 ， 使 用 目标 拷贝 命令 〈obJjcopy) 来 产生 二 进 制 文件 : 


$> arm-none-eabi-objcopy -obinary examplel .out examplel .bin 


我 们 还 可 以 使 用 目标 倾倒 (dump) 命 令 (objdump) 来 创建 一 个 反 汇编 代码 来 检查 生成 的 目标 文 









































作 : 

$> arm-none-eabi-objdump -S examplel.out > examplel.11st 
生成 的 反 汇 纺 应 如 下 所 示 : 

exXxamplel.out: file format elf32-1ittlearm 


Disassembly of section .text: 
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00000000 <_start>: 

0 0800 lsrs r0; TO S32 
2: 2000 movs r0, #0 

4:* 0009. lglg zl; ¥l, #0 


00000008 <start>: 

8: 200a movs r0, #10 
L100 movs P| $0 
0000000¢c <l]loop>: 

C: 1809 adds rl, rl, ro 

e: 3801 subs r0, #1 

10: dlfc pne.n C <loop> 
00000012 <deadloop>: 

12: el/lfe bp.n 12 <deadloop> 


19.3.2 例 2: 连接 多 个 文件 


如 前 所 述 ， 我 们 可 以 创建 多 个 目标 文件 ， 并 且 把 它们 连接 到 一 起 。 在 这 个 例子 里 ， 我 们 有 两 个 
汇编 程序 文件 ， 分 别 是 example2a.s 和 example2b.s。 前 者 只 包含 癌 量 表 ， 而 后 者 包含 了 正 第 的 
程序 代码 。 这 里 ，.global 指示 字 就 派 上 用 场 了 一 一 在 文件 之 前 传递 全 局 符号 。 

三 一 三 一 一 一 一 三 一 二 example2a.s ========== 
/* 定义 常数 */ 

.equ STACK_TOP, 0x20000800 











.global vectors table 
.global start 
.global nmi_ handler 
.Code 16 
.Syntax unified 
Vectors table: 
.WoOrd STACK TOP, start, nmi handler, Ox00000000 


.end 


一 一 一 一 一 一 一 一 一 一 example2b.s ========== 

/* 主 程序 */ 

.text 

.global _start 

.global start 

.global nmi_ handler 

.Code 16 

.Syntax unified 

"type start,; funct1ion 

.type nmi_ handler, function 
_Sstart: 

/* 证 程序 人 辣 局 #/ 
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start: 
movs ED， #10 
movs ed #0 


/* 计算 10 二 9+8.. .+1 */ 


Joop : 
adds rl, r0 
subs Oy #1 
bne loop 
/* 结果 存储 在 R1 中 */ 
deadloop: 
Ie， deadloop 


/* 为 演示 而 设置 的 空 NMI 服 务 例 程 */ 


nmi handler: 


========== end of file ========== 
创建 可 执行 映像 的 步骤 为 : 
1. 汇编 example2a.s 
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$5> arm-none-eabi-as -mcpu=cortex-m3 -mthumb example2a.s -oO example2a.o 


2. 汇编 example2b.s 


S> arm-none-eabi-as -mcpu=cortex-m3 -mthumb example2b.s -oO example2b.o 


3. 把 2 个 目标 文件 连接 成 单一 的 映像 。 要 注意 的 是 ， 











消 


目标 文件 在 命令 行 中 的 顺序 是 重要 的 ， 它 


影响 在 最 终 的 目标 文件 中 ， 把 这 两 个 目标 文件 的 代码 编排 的 顺序 。 


$> arm-none-eabi-ld -Ttext 0x0 -Oo example2 .out example2a.o example2b.o 


2 0 S00 


S> arm-none-eabi-~objcopy -Obinary example2 .out example2 .bin 





5 如 上 例 ， 可 以 创建 一 个 反 汇 编 文件 来 检 丛 所 产生 目标 文件 的 内 容 。 
$> arm-none-eabi-objdump -S example2 .out > example2.1ist 


当 目 标 文 件 增多 时 ， 为 简化 处 理 过 程 ， 我 们 可 以 使 用 make 来 管理 工程 。 另 外 ， 开 发 套件 也 和 锦 


党 有 各 目 内 建 的 功能 来 简化 编译 过 程 。 








19.3.3 例 3: 一 个 简单 的 ”Hello World” 程 序 





前 两 个 例子 算是 热 丑 ， 现 在 该 动 真 格 的 了 。 让 我 们 试 一 个 “hello wor1d” 程 序 。 但 是 在 这 里 
为 了 突出 主题 ， 我 们 省 去 了 UART 初始 化 代码 。 第 29 章 给 出 了 一 个 C 语言 写成 的 UART 示例 代码 。 


/* 定义 常数 */ 
.equ STACK_ TOP, Ox20000800 
.global vectors table 
.global _start 
.Code 16 
.Syntax unifi ed 
Vectors table: 
.WOrd STACK TOP, start 


.end 
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.text 

.global _start 
.Code 16 

.Syntax unifi ed 


‘tyvpe _starty funct1Lion 


_start: 
/* 主 程序 入 口 点 */ 
movs 0; #0 
movs 2 #0 
movs 2 #0 
movs 3 #0 
movs rs; #0 
movs 和 #0 
ldr ro, =hello 
bl puts 
movs 和 人 了 #0x4 
bl putc 
deadloop: 
b deadloop 
hello: 


Sell . "HeLLo\nY 
“Bvte 0 
.align 
puts: 
/* 该 子 程序 向 UART 发 送 字 符 串 */ 
/* 入 口 条 件 : ” r0 = 字符 串 的 起 始 地 址 */ 
/* 字符 串 要 以 零 结 尾 */ 














Push 0 /* 保存 寄存 器 */ 
mov A 0 /* 把 地 址 拷贝 到 R1， 因 为 */ 
/* RO 还 要 用 于 作 putc 的 参数 */ 

putsloop: 

Lepr [EL #1 /* 恋 取 一 个 字符 并 且 目 增 地 址 */ 

cbz r0, putsloopexit /* 如 果 字 人 符 为 NULL， 则 跳 转 到 结束 */ 

bl putc 

b putsloop 
putsloopexit: 

pop {r0, rl, pc} 加 汪 


.equ UARTO_DATA，0x4000C0O00 

.equ UARTO_FLAG, Ox4000C018 
putc: 

/* 该 子 程序 通过 UART 发 送 一 个 字符 */ 
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/* 入 口 条 件 : R0 = 要 发 送 的 字符 */ 


push (和 /* 保存 寄存 器 */ 
ldr rl, =UARTO_FLAG 
putcwaitloop: 
ldr 1 [r1] /* 获取 状态 位 */ 
test w 2, #0x20 /* 检查 发 送 缓冲 区 满 标志 */ 
Bne putcwaitloop /* 如 果 已 满 则 循环 等 得 */ 
ldr Ely =UARTO_DATA /* 否则 继续 往 发 送 绥 冲 区 里 送 数据 */ 
str ro0, [ri1] 
PoP {ly rr E3y Ee] /* 返回 如 
end 


========== end of file ========== 
在 这 个 例子 里 ， 我 们 使 用 了 .ascii 和 .byte 指示 子 来 创建 一 个 零 结尾 的 字符 串 。 在 定义 了 子 从 串 
之 后 ， 我 们 又 使 用 了 .align 来 确保 下 一 条 指令 会 以 正确 的 位 置 开始 。 如 果 不 使 用 .align， 汇 编 如 
则 可 能 把 下 一 条 指令 放 到 未 对 齐 的 地 址 。 

创建 目标 代码 的 步骤 如 下 所 示 ， 谈 者 应 理解 下 述 命令 的 人 台 义 和 作用 。 


S> arm-none-eabi-as -mcpucortex-m3 -mthumb example3a.s -Oo example3a.o 








S> arm-none-eabi-as -mcpu cortex-m3 -mthumb example3b.s -oO example3b.o 
S> arm-none-eabi-ld -Ttext 0x0 -Oo example3.out example3a.o example3b.o 
$> arm-none-eabi-objcopy -Obinary example3.out example3 .bin 


$> arm-none-eabi-objdump -S example3.out > example3.1ist 


19.3.4 例 4: 把 数据 放 到 RAM 中 


RW 数据 需要 放 人 到 RAM 中 ， 本 例 就 演示 在 RAM 中 定义 变量 的 方法 。 
三 一 一 一 一 一 一 三 三 一 example4.s ========== 

.equ STACK_TOP， 0x20000800 

‘text 

.global _start 

,Code 16 

-Svntax Unified 
Start: 

.WOrd STACK TOP, start 


type start,; funct1ion 


start: 
moOVS 0 #10 
moOVS | #0 
/* 计算 10+9...+1 */ 
Joop : 
adds rs r0 
subs 0 #1 
bne loop 
* 结果 现在 存储 a 到 R1 中 了 */ 
ldr Os =result 
Str 和 二 [z0] 
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deadloop: 

b deadloop 

/* 数据 区 */ 

.data 
result: 

.word 0 

. End 
========== end of fi le ========== 

本 例 的 核心 就 是 粗 体 的 .data 指示 字 。 使 用 它 创建 一 个 数据 区 。 在 该 区 中 ， 使 用 一 个 .word 指 
示 字 来 保留 一 个 4 字 节 的 空间 ， 并 且 取 名 为 Result (其 实 result 就 相当 于 Cc 中 的 变量 名 )。 欲 连 
接 本 程序 ， 需 要 告诉 连接 右 RAM 在 何 处 ， 这 可 以 使 用 -Tdata 选项 来 实现 ， 它 把 数据 段 设 置 到 所 需 
的 位 置 上 : 


$5> arm-none-eabi-as -mcpu cortex-m3 -mthumb example4.s -oO example4.o 














$> arm-none-eabi-ld -Ttext 0x0 -Tdata 0x20000000 -o example4.out 
example4.o 
$> arm-none-eabi-objcopy -Obinary -R .data example4 .out example4.bin 
$> arm-none-eabi-objdump -S example4.out > example4.1ist 
还 要 注意 的 是 ， 在 objcopy 中 对 -R .data 选项 的 使 用 。 它 避免 在 二 进 制 输出 文件 中 把 数据 存 
储 区 也 包含 进去 。 


19.3.5 例 5: 纯 cC 程序 


想必 大 家 已 经 受 够 了 在 汇编 下 过 日 子 了 吧 ! 在 GNU 工具 链 中 的 一 个 主要 组 件 就 是 C 编译 器 。 在 
本 例 中 ， 整 个 可 执行 程序 一 一 甚至 是 复位 向 量 和 MSP 初 值 都 由 C 写成 。 此 外 ， 还 添加 了 一 个 连接 器 
脚本 ， 用 来 把 各 段 放 到 正确 的 位 置 。 那 么 ， 先 让 我 们 看 一 看 C 程序 文件 。 














#define STACK TOP 0x20000800 

#define NVIC_ CCR ((volatile unsigned long *) (0xEOO00ED14)) 
// 声明 函数 原型 

void myputs (char *stringl); 

void myputc (char mychar) ; 

int main (void),; 

void nmi handler (void); 

void hardfault_ handler (volId) ; 

// 定义 丫 量 表 


attribute __ (( section(“vectors”) )) void (* const VectorArray[]) (void) = 





| 


STACK_ TOP, 

main, 

nmi_ handler, 

hardfault_ handler 
}; 


// 主 程序 入 口 点 


Int main (void) 
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const char *helloworldl]="Hello: world\n"; 

x*NVIC_CCR = *NVIC_CCR | 0x200; /* 设置 NVIC 的 STKALIGN */ 
myputs (*helloworld),; 

while(1).; 


return(0); 


// 函数 
Vold myputs (char *stringl) 
{ 
char mychar; 
TE 
j=0; 
do 
{ 
mychar = stringl [jl]; 
if (mychar!=0) 
{ 
myputc (mychar);} 
j++; 
} 
} while (mychar != 0) ; 
return; 
} 
vold myputc (char mychar) 
{ 
#define UARTO_DATA ((volatile unsigned long *) (Ox4000C000)) 
#define UARTO_FLAG ((volatile unsigned long *) (0x4000C018)) 
// Wait until busy fl ad is clear 
while ((*UARTO_ FLAG & Ox20) != 0)，} 
// Output character to UART 
*UARTO_DATA = mychar; 


return; 


// 空 的 服务 例 程 
Void nmi handler (void) 


{ 


return; 


void hardfault handler (void) 
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========== end of file ========== 
注意 粗 体 字 显示 的 部 分 , 它 使 用 attribute(( )) (注意 , 是 双 小 括号 ) 来 指定 特殊 的 属性 。 
企 这 时 则 指出 那个 函数 据 针 数 组 套 帮 到 vectors 段 中 的 。 然 而 ， 这 个 C 程序 并 没有 指定 vectors 
段 在 何 处 。 那 么 在 哪里 指定 vectors 上 段 的 位 置 呢 ? 现 在 该 请 出 我 们 的 连接 器 脚本 文件 了 ， 工 作 束 在 
这 里 完成 。 本 例 的 连接 需 脚 本 文件 为 simple.1d， 内 容 如 下 : 
二 二 二 二 二 二 = 二 = 二 Slimple.1ld ========== 
/* MEMORY 命令 : 定义 允许 的 存储 右 区 域 */ 
/* 本 部 分 定义 了 连接 右 人 允许 放 入 数据 的 各 存储 器 区 域 ， 这 是 */ 
/* 一 个 可 选 的 功能 ， 但 是 对 于 开发 很 有 人 蔓 ， 它 使 连接 需 在 在 */ 
/* 程序 太 大 时 能 给 你 警告 */ 
MEMORY 
{ 








/* ROM 是 可 读 的 (r) 和 可 执行 的 (x) */ 
rom (rx) : ORIGIN = 0, LENGTH = 2M 
/* RAM 是 可 读 的 (r)， 可 写 的 (w)， 可 执行 的 (x) */ 
ram (rwx) : ORIGIN = Ox20000000, LENGTH = 4M 
} 
/* SECTIONS 命令 : 定义 各 输入 段 到 和 输出 段 的 映射 */ 


SECTIONS 
{ 
. = Ox0; /* 从 0x00000000 开始 */ 
.text : { 
* (vectors) /* 问 量 表 */ 
* ( .text) /* 程序 代 公 */ 
* (.rodata) /* 只 斌 数据 */ 
} 
. = 0x20000000; /* 从 0x20000000 开始 */ 
.data : { 
(ata) /* 数据 存储 器 */ 
} 
bss { 
*(.bss) /* 预 留 的 数据 存储 器 ， 必 须 初始 化 为 零 * 


为 使 用 连接 脚本 ， 和 十 要 在 编 详 阶段 把 simple.1d 传 给 编 详 项 。 
$> arm-none-eabi-gcc -mcpu cortex-m3 -mthumb example5.C ~nostartfiles 


-IT simple.l1ld -oOo exampleS.o 


然后 在 连接 时 ， 需 要 再 次 使 用 simple.1d。 


$> arm-none-eabi-ld -IT simPpPLle.1Ld -oOo example5 .out examp1le5 .o 


本 例 中 我 们 只 有 一 个 源 文 件 ， 因 此 连接 过 程 其 实 是 可 以 省 略 的 。 最 后 再 创建 二 进 制 目标 文件 和 
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反 汇 编 文件 。 
$> arm-none-eab1i-objcopy -Obinary example5 .out example5 .bin 
$> arm-none-eabi-objdump -S example5 .out > example5.1list 

读者 可 能 还 注意 到 了 , 在 本 例 中 我 们 使 用 了 另 一 个 称 为 -nostartfiles 的 编 详 医 开关 。 使 用 它 ， 
就 可 以 让 编译 器 不 再 往 可 执行 映像 中 插入 启动 代码 (crt)， 这 样 做 的 目的 之 一 就 是 减少 程序 映像 的 
尺寸 。 不 过 ,使 用 该 选项 的 主要 原因 ， 其 实 是 在 于 GNU 工具 链 的 局 动 代码 是 与 发 布 包 的 提供 者 相关 
的 , 而 有 些 人 提供 的 局 动 代 人 码 不 适合 CM3 一 一 它们 往往 是 用 于 传统 的 ARM 处 理 融 的 一 一 如 ARM7 (上 典 
型 地 这 些 局 动 代码 使 用 了 ARM 代码 ， 而 没有 使 用 Thumb 代码 )。 

但 是 , 在 许多 情况 下 , 取决 于 应 用 程序 和 使 用 的 库 , 都 必须 使 用 局 动 代码 来 执行 初始 化 的 过 程 ， 
最 主要 的 就 是 对 数据 的 初始 化 (例如 ， 把 bss 区 的 存储 单元 全 部 清 零 )。 在 最 后 一 个 例子 中 ， 我 们 


将 演示 这 个 过 程 。 
19.3.6 例 6: 纯 C 程序， 带 有 标准 C 局 动 代 公 


在 正常 情况 下 ， 当 编译 C 程序 时 ， 会 目 动 地 把 标准 C 库 的 局 动 代码 包含 在 目标 文件 中 ， 它 保证 
运行 时 库 得 以 正确 地 初始 化 。 标 准 C 运行 时 库 的 启动 代码 由 GNU 工具 链 提 供 , 但 是 不 同 提供 者 提供 
的 工具 链 可 能 有 不 同 的 启动 代码 。 下 例 是 基于 CodeSourcery GNU ARM 工具 链 2666q3-26 版 本 的 。 
因此 ， 最 好 检查 一 下 从 工具 链 中 的 局 动 代码 ， 或 者 从 供应 者 处 获取 最 新 的 局 动 代码 。 对 于 这 个 版 本 
的 CodeSourcery 提供 的 工具 链 ， 其 局 动 代码 目标 文件 为 armv7m-crte.o。 但 是 这 个 版 本 提供 的 
局 动 代码 是 错误 的 一 一 使 用 了 ARM 代 码 来 编写 。 到 了 2686q3-27 及 更 晚 的 版 本 中 才 修 正 了 这 个 bug。 
不 同 提 供 者 的 GNU 工具 链 会 有 不 同 的 启动 代码 ， 而 且 文 件 名 也 常常 不 同 。 此 时 ， 束 需要 检查 你 所 使 
用 的 GNU 工具 链 之 帮助 文档 来 获取 准确 信息 了 。 

在 编译 C 源 代码 之 前 , 例 5 中 的 C 程序 需要 一 些小 改动 。 缺 省 情况 下 ，armv7m-crte 已 经 包含 
了 一 张 癌 量 表 ， 并 且 在 它 里 面 ，NMI 服务 例 程 和 硬 fault 服务 例 程 分 别 取 名 为 nmi_isr 和 
_fault_isr。 因 此 ， 需 要 移 除 例 5 中 的 问 量 表 ， 并 且 重 命名 NMI 和 便 Fault 的 服务 例 程 ， 如 下 所 
不 : 

// 声明 函数 原型 


void myputs (char *string1l); 
























































void myputc (char mychar) ; 
int main (void),;} 
void nmi isr(void); 


void _fault isr(void); 


// 主 程序 入 口 扩 

Int main (void) 

{ 
const char *helloworld[]="Hello world\n"; 
myputs (*helloworld); 
while(1).; 


return(0); 


// 函数 
void myputs (char *stringl) 


{ 
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char mychar; 
> 
J 0 
do 
{ 
mychar = stringl [jl]; 
if (mychar!=0) 
{ 
myputc (mychar),;} 
j++; 
} 
} while (mychar != 0);，} 
return; 
} 
vold myputc (char mychar) 
{ 
#define UARTO_DATA ((volatile unsigned long *) (Ox4000C000)) 
#define UARTO_FLAG ((volatile unsigned long *) (Ox4000C018)) 
// Wait until busy fl ad is clear 
while ((*UARTO_ FLAG & Ox20) != 0);， 
/7 OUtout. Chardadcter. to UART 
*UARTO_DATA = mychar; 


return; 


// 空 的 服务 例 程 
void nmi isr(void) 
{ 


return; 


void fault isr(void) 
{ 


return; 


在 安装 了 CodeSourcery 后 ,已 经 包含 了 一 系列 的 连接 脚本 , 可 以 从 codesourcery/sourcery 
g++/arm-none-eabi/1ib 目录 下 找到 。 在 下 例 中 ， 我 们 束 使 用 了 lm3s8xx-rom.1d 文件 。 这 个 连 
接 器 脚本 顾名思义 ， 是 用 于 LM3S8XX 系列 心 片 的 。 

在 当前 目录 之 外 ， 当 C 程 序 代 码 定位 后 ， 一 个 名 为 “lib” 的 库 子 目录 也 在 在 当前 目录 下 创建 ， 

(Aside from the current directory, when the C program code is located, a library subdirectory called /ib 
is also created in the current directory) 这 使 得 库 搜索 路 径 的 设置 更 加 简单 一 一 所 需 的 目标 文件 
armvrm-crt6.o 以 及 连接 器 脚本 都 被 挡 贝 到 这 个 “1ib” 目 录 下 ,在 下 一 个 例子 中 ,我 们 就 使 用 -L 1ib 
选项 来 把 “1ib” 添 加 到 库 的 搜索 路 径 中 。 
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现在 我 们 可 以 编译 这 个 C 程 序 了 : 
$> arm-none-eabi-gcc -mcpu=cortex-m3 -mthumb example6.c -L lib -TT 


lm3s8xx-rom.1d -oo example6 .out 

执行 了 上 条 命令 后 ， 就 创建 并 且 连 接 了 目标 文件 example6.out。 因 为 只 有 一 个 目标 文件 ， 二 
进 制 文件 可 以 直接 由 它 来 生成 : 
S> arm-none-eabi-objcopy -Obinary example6 .out example6 .bin 

产生 反 汇 编 的 方式 则 与 上 例 相 同 : 


S> arm-none-eabi-objdump -S example6.out > example6.1ist 


19.4 访问 特殊 功能 寄存 器 


在 CodeSourcery 的 GNU ARM 工 具 链 中 , 可 以 直接 使 用 小 写 的 名 字 来 访问 特殊 功能 寄存 器 (注意 ， 
必须 是 小 写 的 )， 如 下 所 示 : 

















msr Control, ol 

mrs rl, Control 
msr apsr, Te 

mrs ry BSr 


19.5 使 用 未 支持 的 指令 


如 来 使 用 了 为 外 的 GNU 工 具 链 ， 有 可 能 那个 GNU 汇 编 融 不 文 持 一 些 指令 。 在 这 种 情况 下 ， 则 可 以 
直接 使 用 .word 来 插入 不 文 持 指令 的 二 进 制 机 右 人 码 ， 如 下 所 示 : 


.equ DW_ MSR _ CONTROL RO, Ox8814F380 








MOV RO, #0x1 


.Word DW_MSR_CONTROL_R0 /* 相当 于 执行 MSR CONTROL，R0 指令 */ 


19.6 GNU C 编译 器 的 内 联 汇编 


GNU 的 ARM C 彤 详 需 是 文 持 内 联 汇编 的 ， 但 此 时 的 汇编 语法 看 起 来 有 点 怪 : 








__asm (" Instl opl, op2... \n" 
" inst2 opl, op2... \n" 
" inst opl, op2... \n" 


: 输出 操作 数 s /* 可 选 */ 

: 输入 操作 数 s /* 可 选 */ 

先 举 一 个 简单 的 例子 ， 进 入 睡眠 模式 的 代码 如 下 所 示 : 
void Sleep (void) 
{ 





// 使 用 Wait-For-Interrupt 进 入 睡眠 模式 
__asm ( 
“WFI\N’” 
) ; 
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如 果 汇 编 代 码 需 要 一 个 输入 变量 和 一 个 输出 变量 ， 例 如 ， 把 一 个 变量 除 以 5， 则 格式 如 下 : 
asm ("mov r0, $0\n" 
"mo 3, AN 
Todry Oy YO EN 
WMOoOv SLs -TONn 
: "=r™" (DataOut) : "rr™" (DataIn) : "cc" "r3™ ) ; 
在 这 个 代码 中 ， 输 输入 参数 是 一 个 Cc 变量 ， 名 为 DataIn(%e 代 表 第 一 个 参数 )， 该 代码 把 结果 返 
加 到 邦 外 一 个 C 变 量 Data0ut 中 〈%1 表 示 第 2 个 参数 )。 内 联 汇编 的 代码 还 手工 修改 了 寄存 左 r3， 并 
用 修改 了 条 件 标 志 cc， 因 此 它们 被 列 在 被 破坏 的 《clobbered) 寄存 器 列表 中 。 
更 详细 的 内 联 汇编 信息 在 GCC-Inline-Assembly-HONTO 文 档 中 。 
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KEIL RealView Microcontroller 


Development Kit ( RVMDK ) 使 用 入 门 


简介 

uVision 使 用 入 门 

使 用 UART 输出 “Hello World” 
测试 示例 程序 

使 用 调试 需 

指令 模拟 器 

修改 回 量 表 

使 用 中 断 实现 的 秒表 示例 程序 


20.1 简介 


有 许多 商业 的 开发 平台 可 以 用 在 CM3 上 ， 其 中 最 流行 的 之 一 就 是 KEIL 的 RealView 
Microcontroller Development Kit (简称 RealView MDK 或 RVMDK)。RVMDK 的 前 身 就 是 曾 一 
度 在 8651 开发 业界 享有 盛誉 的 KEIL 套件 。RVMDK 包含 了 很 丰盛 的 组 件 : 

国 ”UVision 
加 ”集成 开发 环境 
国 调试 红 
图 
图 











模拟 需 
由 ARM 提供 的 RealView 工具 链 
令 C/C++ 编译 器 
令 ”汇编 右 
令 ”连接 需 
RTX 实时 内 核 
为 各 单片机 而 设 的 详细 局 动 代 码 〈 包 含 源 代码 ) 
各 种 Flash 的 编程 算法 
程序 示例 
〈 英 伴 特 还 把 RVMDK 的 帮助 文件 翻译 成 了 中 文 ， 并 包装 成 “中 国 版 ”的 RVMDK 一 一 详 者 注 )。 
使 用 RVMDK 来 学 习 CM3， 其 至 不 需要 拥有 CM3 便 件 一 一 uVison 环境 包含 了 指令 模拟 右 ， 使 用 
它 可 以 测试 “纯粹 ”的 CM3 程序 代码 ， 对 于 学 习 和 开发 基于 内 核 的 系统 软件 都 很 有 好 处 。 
RVMDK 还 可 以 与 GNU 工具 链 一 起 使 用 。 
可 以 从 KEIL 网 站 上 获取 免费 的 KEIL tool 之 演示 版 ， 也 可 以 从 
http://www.realview.com.cn/ 处 下 载 中 文 的 相关 资源 。 
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20.2 uvVison 使 用 入 门 


在 RVMDK 中 附带 了 很 多 示例 程序 ， 包 括 Luminary Micro 的 Stellaris 系列 的 单片机 产品 ， 
也 包括 了 ST 的 STM32 系列 的 单 上 请 机 产品 。 这 些 示 例 都 使 用 了 广 家 提供 的 驱动 程序 库 《〈 固 件 库 )。 使 
用 固件 库 可 以 免 去 写 代 人 码 操 作 外 设 寄存 器 的 任务 。 很 容易 通过 修改 示例 程序 来 开发 目 己 的 应 用 程序 ， 
也 可 以 目 己 从 头 设 计 工 程 ， 再 摘抄 一 部 分 示例 程序 的 代码 。 本 章 的 示例 基于 RVMDK v3.83 版 ， 并 
且 以 Luminary Micro 的 LM3S811 器 件 为 蓝本 (目前 RVMDK 已 经 出 了 3.26 版 ， 且 作者 写本 书 时 
Luminary Micro 是 唯一 的 CM3 心 片 供应 商 。 目 前 ST 也 出 品 了 STM32 系列 的 CM3 心 片 ， 预 计 以 后 
Atmel，TI，NXP 也 要 提供 CM3 心 记 一 一 详 者 注 )。 

在 安装 了 RVMDK 后 ， 束 可 以 从 开始 采 单 中 局 动 uVision 集成 开发 环境 ， 并 且 它 会 打开 一 个 为 
传统 ARM 处 理 器 而 写成 的 示例 。 我 们 可 以 关 挥 这 个 工程 ， 并 且 通 过 选择 ”New Project” 下 拉 末 早 来 
新 建 一 个 工程 : 


I 工本 


Edit View (Project| Debue Flash Feripherals Tools SVWLS Window Help 


a Hew HYision Froject... 
基 回 加 


Hew Froject Workspace... 



































Import PVYisionl Froject... 
‘Workspace Dpen Project... 


Nanapee kh 


这 里 创建 了 一 个 名 为 CortexM3 的 文件 来: 
Create Hew Project 加 | 区 | 


你 仔 广 [I): | CortexN3 到 条 此 EE 车 守 > 
[3 我 最 这 的 六 和 





[车 Keil 
DD EN 
I RY31 
[DD Exramples 
I ort ex 
二 有 SOFT MM:) 
二 PRIVATE (FE:) 
cp REFHY IF:) 
ip SISING (GG:) 
Sp SYS2 IH:) 
3p BEUF 并 :) 
a ETC 盯 : 
Eh pmdio CD 并: 


2 DVD 最 动 强 前 :) 
< 二 FIHGSTOHN WH:) 保存 多 ) 
思 共享 供 档 — 、 
包 ] 网 上 邻居 开放 | , 





本 
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接 下 来 为 这 个 工程 选择 目标 器 件 ， 在 这 里 选择 LM3S811 


Select Dewvice for Tareget Target 二 


FFU | 


Vendor: Luamlmary Micro 


Dewice: LM3SS11 
Toolset PRM 


Data base Descript1 on.: 


LMS3SBI938 Cortex-M3 based Microcontroll]er: 
32 ID pins 
DNSbooe 32 Interrupts with 8 Frioritw lewels 
LN3SSB9BS Up to 了 Timers 
Real Time Clock 
0 Watchdoe Timer 
DMS311 1 hnalve Comparator 
LNWN3s61z 4 10-bit MD channels 
B EWN and B Capture/Compare charnmnels 
IJW32615 2 I RTS 
DNS31T 1 工 各 sp;C interftace 
LIN3S818 SR 
Fower dowrn Mode 
I Ide Mode 
DNSoo 20 Brown-out Detecti or 


\ 加 








现在 我 们 有 了 只 含有 一 个 源 文 件 (Startup.s) 的 工程 了 : 
File 了 dt View FProject Debue Flastkh. 





FE Target 1 


Project “Workspace 


一 = 二 Target 1 


= Souree Group 1 


Startup.s 


接 下 来 ， 我 们 要 创建 一 个 含有 main 阔 数 的 C 源 程序 。 


File| Edit View Erolec+t Debue Flash 了 erlp 





Ctrlt+H 


Fed rr 广 +w1+ 门 








这 样 就 创建 了 一 个 文本 文件 。 编辑 它 的 内 容 ， 并 且 存 储 为 hello.c: 
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国 习 2:V 玉 ETA 及 而 有 TY 了 TYVEaDp1LesvCorteI 丰 3vhel1o。c 


1 Hinclude "stdio.h"" 

2 1nt malnrunold) 

3 

4 printft"Hello worldtn™"y; 
5 while ti1iy : 

bp 

7 | 





A a Source Group 1 中 (和 右 击 Source Group 1) 





“5 | 二 En 
闸 析 上 西 Te | 昌 吕 二 E 





Project Workspace x | 


ET EF Tareet 1 
晶 : 守 Souree Group 1 










Hew troup 


hdd Files to Groop Source Groop 1 


是 Nanaeze Components 
Remove Group Souree Group 1 and its Files 





Jnclude Dependencles 











可 以 修改 目标 名 “Target 1” 和 文件 组 名 “Source Group 1”， 以 使 它们 更 有 意义 。 通 过 单 
击 工 程 的 工作 区 选中 它们 ， a a 0 


Project i 
ET 
国史 一 Source Wroup 1 
选择 我 们 刚刚 创建 的 hello.c 并 添加 ， 则 工程 中 束 包 含 了 2 个 源 文件 了 : 
刁 泣 醒 所 器 
9 全 Souree Group 1 
Sse ll Starturp. 5 


i.... … | 村 hello = 
我 们 还 需要 设置 连接 器 以 定义 程序 的 入 口 点 。 通 过 在 “Misc Controls box” 中 加 入 entry 


EA 











270 


Cortex-M3 权威 指南 第 26 章 


Reset_Handler 来 实现 。 这 个 选项 定义 了 程序 的 入 口 点 为 Reset_Handler 一 一 它 可 以 在 
startup.s 中 找到 (其 实在 RVMDK 3.26 版 本 中 , 连接 设置 有 了 变化 ,此 时 不 加 也 可 以 一 一 译 者 注 )。 


Wptions for Tareet “ 棉 拟 贡 : 





Desiee | Target | Dutput | Listing | User | C/C++ | hsm Linker | Debus | Utilities | 


|Iw Use 人 emory Lavout from Tareet Dialve 


| Make EW Sections Fosition Independent RID Base: | 
| Make RD Sections Fosition Independent 


FiW Base px20000000 
| Dom +t Search Standard Libraries 
a I 


Scatter | ® 下 
File rit. | a 


[| ——entrvw 及 eset Harndler 


Linker |*.o --device DINM 一 一 striet 一 Seatter "hlwd. set 
control 
strine 





现在 我 们 束 可 以 编 详 了 了。 如 下 所 未 : 


. Dptions for Target “ 蛋 撕 九 


Dpen .hlwd. 四 ap 








E 
| TE 


顷 详 成 功 后 ， 输 出 窗口 如 下 显示 : 
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Euild tardet 
Aa3S3eEImm1l1indg Startup.3,... 

COMmMPILIlindg hello.cG... 

1inkind... 

Prodgram dle: CoOode=S5086 FRO-data=t2: RU-data=lét I-data=sSein 
"Thliwd.axt™. —- DO 上 ro ES， DO Warnindgisl. 


utput Vvindowvy 


Build omrmand Find in Files 


20.3 使 用 UART 输出 “Hello World” 








在 上 一 个 例子 中 , 我 们 使 用 了 Cc 标准 库 中 的 printf 也 数 。 但 是 C 标 准 库 并 不 知道 我 们 使 用 的 便 件 
是 什么 ， 因 此 如 果 要 “真实 ”地 输出 罕 符 串 〈 如 通过 UART 和 输出)， 还 必须 添加 一 些 代 码 。 正 如 本 书 
曾经 提 到 的 ， 为 使 输出 送 到 实际 的 便 件 ， 我 们 经 党 需要 做 所 谓 的 “retargeting” 工 作 。 与 
Retargeting 相 关 的 函数 除了 可 以 用 于 输出 文本 外 ， 还 可 以 包含 处 理 错误 以 及 终结 程序 等 其 它 功 能 。 
在 本 例 ， 只 介绍 文本 输出 的 功能 。 

在 本 例 中 ， 是 打算 把 ”Hello World” 消 息 从 LM3S811 的 UART6 送 出 去 ， 目 标 系 统 是 Luminary 
Micro LM3S811 评 估 板 。 板 上 品 振 为 6MHz, 但 单 户 机 所 内 配 有 PLL 模 块 , 它 把 时 钟 频 靳 上 升 到 56MHz 。 
波 特 率 是 115,266， 并 且 使 用 PC 上 的 超级 终端 程序 来 接收 从 UART 必 出 的 数据 。 

要 对 printf 执 行 retarget 人 处理 , 我 们 需要 实现 fputc 水 数 。 在 下 和 面 的 代码 中 , 我们 束 创 建 了 这 
个 fputc 函 数 ， 它 又 呼叫 sendchar 函 数 ， 而 后 者 则 操作 UART 输 出 字符 : 

#include "stdio.h" 





#define CR 0x0D // 回 车 符 
#define LF OxOA / /换行 符 
void UartO0OInit (volId) ; 

Vold SetClockFregq(void); 
int sendchar (int ch) ; 

// 若 使 用 6MHz， 则 注释 掉 下 一 行 
#define CLOCK50MH2Z 





// Register addresses 


#define SYSCTRL RCC ((volatile unsigned long *) (Ox400FE060)) 
#define SYSCTRL RIS ((volatile unsigned long *) (0X400FEO0O50) ) 
#define SYSCTRL RCGCI1 ((volatile unsigned long *) (0x400FE104)) 
#define SYSCTRL RCGC2 ((volatile unsigned long *) (0x400FE108)) 
i#define GPIOPA AFSEL ((volatile unsigned long *) (0x40004420)) 
i#define UARTO_DATA ((volatile unsigned long *) (0x4000C000)) 
#define UARTO_FLAG ((volatile unsigned long *) (0x4000C018)) 
#define UARTO_IBRD ((volatile unsigned long *) (0x4000C024)) 
#define UARTO_FBRD ((volatile unsigned long *) (0x4000C028)) 
#define UARTO_LCRH ((volatile unsigned long *) (0x4000C02C)) 
i#define UARTO_CTRL ((volatile unsigned long *) (0x4000C030)) 
#define UARTO_RIS ((volatile unsigned long *) (0x4000C03C)) 


Int main (void) 
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SELCLOCKE PST () > // 建立 时 钟 的 配置 (50MHz/6MHz) 
UartOInit () ; // 初始 化 UART0 
Drintft. (ello worLladl un’), 
while (1);，; 
} 
void SetClockFreqg (void) 
l 
#ifdef CLOCK5OMHZ 
// 置 位 BYPASS， 清 除 USRSYSDIV 和 SYSDIV 
*SYSCTRL_RCC = (*SYSCTRL RCC & OxF83FFFFF) | 0x800 ; 
// 清 零 0OSCSRC，PWRDN 和 OEN 
*SYSCTRIL RCC = (*SYSCTRL RCC & OxFFFFCFCF); 
// 修 改 SYSDIV， 设 置 USRSYSDIV 和 crystal 位 段 的 值 
*SYSCTRL_RCC = (*SYSCTRL RCC & OxF87FFC3F) | 0x01C002C0; 
// 等 待 ELLLRIS 被 置 位 
while ((*SYSCTRL RIS & Ox40)==0); // wait until PLLLRIS is set 
// 清除 bypass 
*SYSCTRL_ RCC = (*SYSCTRL RCC & OxFFFFF7FF) ; 
#else 
// 置 位 BYPASS， 清 除 USRSYSDIV 和 SYSDIV 
*SYSCTRL_RCC = (*SYSCTRL RCC & OxF83FFFFF) | 0x800 ; 
#endif 
return; 
} 
void UartO0OInit (void) 
{ 
*SYSCTRL_RCGC1 
7 LOGk 


*SYSCTRL_RCGC1 | 0x0003; // 使 能 UARTO & UART1 


x*SYSCTRIL_RCGC2 = *SYSCTRIL _RCGC2 | 0x0001; // 使 能 PORTA 时 钟 
*UART0_CTRL = 0; // 除 能 UART 

# ifdef CLOCK5OMHZ 

27; // 以 50MHz 频 率 为 基准 编程 波 特 率 
*UARTO_FBRD = 9; 





*UARTO_IBRD 


# else 





3; // 以 6MHz 频 率 为 基准 编程 波 特 率 
*UARTO_FBRD = 17; 


*UARTO_IBRD 


# endif 

*UART0_LCRH = 0x60; // 8 b 让 ， 无 奇偶 
0x301; // 使 能 Tx 和 RX， 以 及 UART 使 能 
*GPIOPA_AFSEL = *GPIOPA AFSEL | 0x3; // 把 GPIO 管 脚 交 给 UART0 控 制 


*UARTO_CTRL 


return; 
} 
// 送 给 UART0 一 个 字符 (printf 函 数 使 用 它 来 输出 文字 ) 
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int sendchar (int ch) 
{ 
if {eh == TV) 
{ 
while ((*UARTO_FLAG & 0x8)); // 如 果 URART 忙 碌 中 则 等 待 





*UARTO_DATA = CR; // 输入 附加 的 cR 以 使 字符 串 被 正确 显示 
} 
while ((*UARTO_FLAG & 0x8)); // 如 果 URART 忙 碌 中 则 等 待 
return (*UARTO_DATA = ch) ; // 输出 数据 


} 

/ /文本 输出 的 retargeting 代 人 码 
int fouUte(lint Ch ELERB. *E) 
{ 


return (sendchar (ch) ) ; 


代 但 中 的 SetupClockFreq() 用 于 把 系统 时 钟 设 置 为 56MHz。 要 注意 的 是 这 个 函数 是 与 具体 的 
器 件 相 关 的 。 另 外 ， 还 使 用 了 条 件 编 译 来 允许 选择 使 用 6MHz 的 原始 频率 。 

UART 的 初始 化 是 由 UarteInit() 来 执行 的 ， 它 设置 了 波 特 率 为 115266，8 个 数据 位 ，1 个 停止 
位 ， 无 奇 个 校 验 ， 并 且 启 用 GPIO 的 第 二 功能 ， 从 而 让 GPIO 挥 制 费 把 管 脚 的 控制 权 交 给 UART@。 在 使 
用 UART 和 GPIO 之 前 ， 必 须 先 启 用 这 两 个 模块 。 代 人 码 中 的 把 SYSCTRL_RCGC1 和 SYSCTRL_RCGC2 分 别 
启用 了 这 两 个 模块 。 

Retargeting 的 代码 是 由 粗 体 的 fputc() 执 行 的 。 要 注意 的 是 ， 不 能 使 用 其 它 的 名 字 ， 
为 ”fputc” 是 编译 器 预定 义 的 用 于 字符 输出 的 函数 名 。fputc() 实 际 上 只 是 个 封皮 ， 它 直接 调用 
sendchar() 来 做 真实 的 工作 。sendchar() 除 了 输出 一 般 的 字符 之 外 ， 还 要 在 检测 到 ”An 时 输出 一 
个 附加 的 CR， 才 能 在 超级 中 断 上 正常 显示 回 和 车 换行 ， 否 则 将 回 到 同一 行 的 起 始 处 ， 使 先前 输出 的 字 
符 被 狐 输出 的 字符 覆盖 拖 。 

在 加 入 retargeting 代 码 后 ， 就 可 以 重新 编译 了 。 


20.4 测试 示例 程序 


如 果 有 便 件 设备 ， 则 可 以 把 编译 好 的 程序 下 载 到 Flash 并 且 运 行 ， 步 又 如 下 : 
1。 配置 flash 下 载 选项 : 

















ETIT ARNE TamplesiLorter 


1 (Flash| Feripherals Tools SVYCS Windo 


LA 


Fa Download 


a 





Contiaeure Flash Touls... 
Et SCdLLPF 一 
2. 选择 使 件 平台 
Confiaure Flash Merm Command 


i Use Tarezet Driver for Flash Froarammine 


Duminarvw Ewal Board Settines | 
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3。. 接 下 来 束 可 以 下 载 程 序 到 flash 中 了 


用 | 区 | 模拟 器 
4. 下 载 完 后 ， 程 序 将 开始 运行 ， 在 超级 终端 上 应 看 到 如 下 字样: 








让 忻 于 ) 叫 辑 夺 】 查看 


| Hello worldet 


20.5 使 用 调试 器 


uVision 中 附带 了 调试 器 ， 这 是 一 个 可 视 化 的 源码 级 调试 器 。 可 以 把 它 连 接 到 目标 板 上 (通过 
]TAG 仿 真 器 )。 在 设置 时 ， 单 击 “ 麻 术 棒 ”按钮 ， 


Dptions for Tareet 





再 在 弹出 的 对 话 框 中 选择 ”Debug” 选 项 卡 ， 并 且 如 下 设置 : 
ptions for Tareet “ 横 拟 其 : 


Desiee | Target | Dutput | Listing | lser | C/C++ | hsm Linker DebuE | Utilities 


i Use Simulator Settines ] Luminarw Ewal Board Settines | 


| Limit Speed to Real-Time 


I Load hpplication at Start lw Fun to main ly I Load hpplication at Starti| Fun to main tl) 


Tnitialiratiuon Tnitialiratiuon 


| ll ll 


Restore Debug Session Settines Restore Debue Session Settines 
|Iw Breakpoints I Toolbox I Brealkpoints |w ToolLbox 
[atchpoints 名 Fh I Watchpoints 


[ee Memory Displaw [we Memory Displaw 


CFU DLL : 了 Parameter : Driwer DLL: Far ameter: 


SAEMCMS. DLL | ShEMCMS. DLL 


Dialoez DLL: Farameter: Dialoz DLL: Farameter: 


DDN DLL -pIM3S81 1 TUI DLL -pLM3S811 








接 下 来 吏 可 以 月 动 调试 了 。 但 要 注意 的 是 : 如 末 板 子 已 经 在 运行 并 且 连 上 了 超级 终 上 中， 则 需要 
天 财 超 级 终 顺 ， 断 开 UsB 电 绑 ， 并 且 在 开始 调试 乙 前 再 重 痢 连接 。 
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说 四 


当 调 试 右 开始 工作 后 ，IDE 会 提供 一 个 寄存 占 视 图 ， 显 示 当 前 寄存 器 的 内 容 (通用 寄存 器 和 特 
丈 功 能 寄存 占 都 有 )。 还 可 以 从 源码 级 上 看 到 程序 当前 的 执行 进度 。 从 下 图 中 我 们 可 以 看 出 刚 开 始 
执 行 时 的 情 况 一 一 内核 停止 在 Reset Handler 上 : 


| 


File Edit View Project Debug Flash Peripherals Tools SVYCS Window Help 
前世 加 和 印 / * 昨 启 叶 人 | 在 让 bh%% 罗 时 入 泌 |+ + 如 | 生 | 风 | 码 网 各 了 厅 四 
竺 怕 四 直 嫂 下 刘 虽 中 仁 | 乱 | 剧 学区 | 国 芭 寺 喝 总 入 









































Project Workspace -x| 
Register | Value | EE 回 | 
-Core 
RD 0x00000000 
Rl Dx00000000 150 
R2 0x00000000 151 
R3 Dx00000000 152 
R4 Dx00000000 153 ENXPORT Reset Handler 
BR5 Dx00000000 154 Reset Handler 
FB 0x00000000 155 
RT Dx00000000 156 
了 Dx00000000 157 
R9 Dx00000000 
R10 0x00000000 158 
Rll 0x00000000 153 
Rl2 Dx00000000 160 
R13 (SF] Ox20000230 161 
Rl4 (LR) Dx EfEEEEEE 162 IMPORT main 
一 BR15 (Fc) Ox000000£0 163 B a 
(+) xPSR Dx01000000 = 
NSP 0x20000230 165 AS | 
FSP Dx00000000 1BB 168: ; simply enters an infinite loop, preserving the system state for examina 
+ System 1B7 169: ; by a debhugger. 
-Internal 168 i170 3 
Mode Thread 169 人 T1: 上 宙 太 太 胡 太太 沿 太 而 太 市 页 丰 证 页 记 太 页 太 市 页 太太 市 记 衣 页 市 太太 页 衣 太 页 衣 古 页 记 证 页 调 页 认 调 认 认 胡 市 页 太太 页 太太 太太 市 页 记 古 页 记 古市 记 古 太太 语 古市 
Frivileee Frivileeed 170 172: NmiSR 
Stack MSP 
States 0 171 Reset Handler: 
Sec 0.00000000 172 Nmis D>0x000000FD FDDDBBOD4 B.W __main 10x000000FC) 
vo DXxXDDDDODODF34 ET?FE B DXxDDDDODODF34 
DXxXDDDDODDF 6 下 ?了 FE EB DXxXDDDDODDF 6 
ext Editor AcxooooooFS FE7FE B Ox000000F8 
DxDoDoDDDDF aa DoDobo DC 可 DXxXDDODD 
__ main: 
DxDDDDDDFC FOOOFS802 BEL.W __ scatterload rtz thurb only lOx00000104) 
DxO0000100 FOOOFSES BL.W _rt entry lOx000002CE) 
__ scatterload rtz thuwb only: 
DxO0000104 200N 了 DR roO,{pce}+4 ”aoxobooool3o0 
DXxDDDDoD1iD6 ESSDDCDD LDM rO, {ri0o-riil} | 
DxO000010C 4483 LDD he et i ls eh | 
DxOO00010E Fi220701 SUB r7?,r1i0,#0x01 
__ scatterload null: 
hello.c 国 Startup.s 区 misassenty| 





会 在 运行 到 main() 时 自动 停止 )。 
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2 23 int main {void) ”| 
了 24 4 
4 29 SetClockFreq(t};r nn 
ab ee 2 Undo 
3 27 printtf ( "Hello 1 
全 28 while 17: 
3 2 

ee | = 本 

32 HiFfdef CLOCKSOBHHz 

了 

3234 共 4 CTRL RGEG = | select All 

xSyePrTRL RECR = ， Show Disassembly at OxON000206 

| Set Froeram Counter 
x SETRL RCC 













OxwxO0000114 TILDT 
OxO0000116 FOOOFSDI 1 
DOxODO000112 F222FOEOS 
DxDDODDTTLE ESBLAOOOF Co To Line 


hellno. ec 国 Startup. s 人 sassan = 


xamplesy CortexM3" ,hlad. LAF Clear complete Code Coveraee Info 


Furn to Cursor line 

















Go To Reference To :’ 


Go To Definition Df ”:” 








(也 可 以 双击 main() 入 口 处 “SetClockFreq()” 前 面 的 空白 , 或 者 是 它 的 行 号 “25” 来 快速 
切换 断 点 )。 





了 | Hdefine UNRTB RIS 

?2 int maln (tuold) 

Fe 二 

让 | setClockFreq(y; 

?5 UartAInitrt}; 

tb printf ( ”Hell10 wor 
上 图 的 红色 实心 矩形 表示 断 点 已 经 设 好 。 接 下 来 运行 程序 : 








姥 | 加 人 站 了 


Project dRunbace 











程序 将 堡 在 断 扣 处 : 
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162 IMPORT maln 













区 Disassenmbly 













DxDDDDDTLEa F4206000 BIC DO.,rD,#0x300 
] DxODONOOD1FE 44915 LIR rl, [Pe,#84] ” MDxoDoooDoz 5 
] DXDODOUODDzDD &608 STR DO, [rl1,#0Ox50] 
] 48: } 
] DXDODDDDzDz 4770 BE 1r 
] 之 二 :1 
] DxwO0D0000204 BS10O PUSH { 工 卫 ， 工 工 } 
SetCLDCKFLTECT) : ”建立 
26: UartDIniti).: Fr OL 
] OxwOD00O000202& FTFFFFB1 BL.U Uart0OInit TOXODOOODDTLYDI 
SA 自 C: Eeil\ARE\ RTIlIN\Eranples\CorterzB3 hello.c 
1 oxoo00002190 22 i#define UARTA_RIS (Civuolatile Uns1LI 
1 28: 23 int main (tuoid) 
4 oxo000021 相 24 1 
Te DxDDOODDz IT 创 喇 25 setClockFregqt); 
Rl 26 UartaInitry): 
了 2 1: 27 printf ( "Hello world*\n"y); 
Dx0000021 人 Ml 28 while (1y-: 
DxDoDoDbzl 训 29 } 





黄色 小 箭头 表示 停止 后 即将 执行 的 语句 。 从 图 中 还 可 以 看 到 ， 反 汇编 窗口 也 对 应 地 显示 了 这 个 断 点 所 处 的 指令 
位 置 。 译 者 使 用 的 是 模拟 器 ， 因 此 还 能 记录 曾经 执行 过 的 语句 。 图 中 绿色 小 块 就 表示 已 经 执行 过 的 语句 /指令 。 细 心 
的 读者 可 能 会 发 现 ,“{ ”竟然 也 被 “执行 ”了 【〔 因 为 是 绿色 小 块 )! 事实 上 ,“{ ”被 编译 后 产生 了 汇编 指令 。 看 一 下 
反 汇 编 窗 口 一 一 原来 “{(” 处 的 机 器 码 是 一 条 “PUSH ”{r4,1lr}” 指 令 。 


20.6 指令 模拟 器 


uVison IDE 还 附带 了 一 个 软件 模拟 器 ， 它 可 以 用 来 验证 算法 的 各 项 性 能 指标 ， 也 是 学 习 CM3 的 
好 帮手 。 大 欲 使 用 模拟 器 ， 只 需 在 刚才 的 “Debug” 选 项 里 点 中 Simulator : 




















Dewice | Tareet | Dutput | i 


| Limit Speed to Real-Ti 


I Load Application at St 


事实 上 ， 调 试 器 还 对 片上 外 设 包 装 了 非常 丰满 和 直观 的 可 视 化 操作 接口 ， 模 拟 器 也 可 以 模拟 它 
们 。 比 如 ， 欲 查看 NVIC 的 内 部 状态 ， 可 以 通过 如 下 朋 蛙 命令 启动 : 
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Flash |Feripherals| Tools SYS Window Help 


FT Reset CPY 


System Control 
General Furpose LAD 


UPARTS 

AD 

Vatchdoe 

PHMS 

hnaloez Comparator 





工 2L Interface 


1 FA。 








Mon-maskabIe Interrupt 
Hard Fault 

Memory hanagement 
Bus Fault 

Usage Fault 

Sustem Service Call 
Debug hionmitor 

Pend Suwstem Service 
sustem Tick TImEI 
GRID Port 

GRID Port B 


selected |nterrupt 
Ilw Enable | Pending 


Interrupt Control & State 
INT_CTRL ST: 10x00000000 


| RETTOBASE 


| ISRPREEMPT 


reneral Purpose Timers k 


SvTohronous Serlal TIntertace 


| Bective 


a | 号 号 | 区 


EL 


| Core Feripherals Hested Vectored Interrupt Controller ] 


System Control and Confieuratlon 
k Svstem Tick Timer 


Fault Repurts 





TH 二 1 T 


hl 
HaRDFSULT 
MEMFSULT 
BUSFAULT 
UGFAULT 


1 一 已 


MDONITDR 
PENDSY 
SYSTICK 


mm 


| 证 
Priarity: 0 


wELTaLCTIwE: DO 


ywECTPENDING: DODU 
| 1SRPENDING 


Spplication Interrupt & Peset Control 


UsFAaDobD0U0 
_| wECTRESET 


2lRL: 


_| YECTCLRACTIYE 


Vector Table Offset 
TO: O000000000 


5oftware [nterrupt Trigger 
Sy TRIG_INT: I0x00000000 








PRIGROUP: lo: i.1 | 


_| SYSRESETREQ 
| ENDIANESS 


TBLOFF: (Ox000000 
| TBLBASE 


IMTID: |0x00 








可 以 在 它 上 和 耐 单 击 不 同 的 异常 来 俘 看 相关 状态 ， 上 图 中 就 盈 看 了 SVC 寞 第 的 状态 。 
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在 使 用 模拟 桌 时 ， 如 果 被 模拟 的 右 件 比较 新 ， 则 有 可 能 右 件 中 对 些 地 址 范围 模拟 占 没 有 来 得 及 
更 新 。 这 样 在 使 用 模拟 占 时 ， 就 会 被 判定 成 访问 落空 的 地 址 围 ， 因此 产生 fault。 比 如 ， 本 例 中 ， 
为 了 傈 证 UART 寄 存 闫 的 地 址 范围 补 文 持 ， 可 以 使 用 如 下 的 荣 单 命令 检 奏 : 


:+t | DebuEgl Flash Peripherals Tools SSVYLES Window Help 








[加 StartiStop Debue Sessinon Ctrlt+Fs a 
+ 1 | Run F5 
fH} Step F11 
{Hh Step Dwver F10 
l {H Step Dut of current Function Ctrl+Fll 
HY Fun to Cursor line Ctrl+F10 
LM Breakpoints... Ctrl+EB 


Insert/Remowe Brealkpoint F9 


























Kill] Ml Preakpoints Ctrlt+shi 于 + 十 了 日 
Show Hext Statement 


0 
WR Disable Ml Breakpoints 
赐 
dy 





Debue Settines 


品 坟 Enable/Disable Trace Recordine 


Execution Frofiline k 


Setup Loglc hnalvrer... 


Nemoryw Map... 





UAF 


| i 














Function Editor IDOpernr Ini File)... 
NPRM TT PE nr 


执行 后 ， 弹 出 如 下 对 话 框 : 
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下 E 了 DIE7 kin 


Current Mapped 


O01: Ox0000083C - Ox0000FFFF ewec read 
: x20000000 - Us2DUDUTFFF read write 

: D40000000 - Ox40000FFF read vrite 

: Dw40004000 - D40008FFF raead write 
D4000DFFF read write 

: x40020000 - D40020FFF read write 

: D40024000 - Ox40024FFF read vrite 


NAMIONMNN MANNMNTIOCCC rd rt 
KSelected Range | 
Map Range - Example: O40000000., O4000FFFF 
Dx4000CO00.0x4000DFFF 
|Iw Read 


[rites 
| Execute Map 有 snge 





本 例 中 UART 寄 存 器 的 地 址 范围 是 6x4668 C666-6x4668 DFFF。 译 者 使 用 的 RVMDK 版 本 较 新 ， 
己 经 加 入 了 本 地 址 范围 。 但 是 原著 作者 使 用 的 RVMDK 版 本 还 没有 加 入 ， 需 要 手工 添加 ， 语 法 如 上 图 
被 框 住 的 部 分 所 示 。RVMDK 的 调试 器 会 自动 合并 “碎片 ” 对 于 译 者 使 用 的 RVMDK， 它 会 发 现 手 工 添 
加 的 内 容 与 原 有 的 重合 ， 故 而 不 会 有 任何 影 啊 。 





uVision IDE 的 调试 功能 非常 强 大 ， 很 多 没有 想到 的 功能 它 都 有 ， 简 列 如 下 : 

@ 观察 窗口 ， 函 数 调 用 栈 窗口 ， 监 视窗 口 等 

@ 计算 到 目前 为 止 已 经 经 历 的 周期 数 

@ 计算 每 条 指令 被 执行 的 频 率 〈 性 能 分 析 非 党 有 用 ) 
@ 逻辑 分 析 仪 
© 
© 

















源 程序 中 的 各 种 符号 窗口 (文件 名 ， 变 量 名 等 
存储 器 映射 窗口 
限于 篇 幅 ， 本 书 不 能 详细 地 讲述 RVMDK 的 方方面面 。 但 好 消息 是 市 面 上 新 出 了 一 本 
专门 讲解 RVMDK 的 书 ， 书 名 为 《ARM 开 发 工具 RealView MDK 使 用 入 门 》 作者 : 李宁 。 
北京 航空 航天 大 学 出 版 社 出 版 。 
ZU TLXITJEEAR 




















在 上 例 中 ， 回 量 表 在 Startup.s 中 已 预先 定义 ， 这 是 由 开发 工具 提供 的 癌 量 表 模 板 ， 它 只 包含 
了 必 备 的 MSP 初 始 值 、 复 位 癌 量 、NMI 问 量 以 及 人 硬 fault 回 量 。 但 是 我 们 往往 还 要 响应 其 它 中 断 ， 
此 要 添加 其 它 的 问 量 ， 或 者 需要 把 预先 提供 的 同 量 也 改 成 目 己 的 。 在 这 些 场合 下 ， 束 要 更 改 
Startup.s 的 代码 ， 把 向 量 表 中 对 应 的 位 置 写成 我 们 提供 的 服务 例 程 名 。 

但 问题 又 来 了 ，ISR 不 是 在 startup.s 中 实现 ， 而 是 在 其 它 文 件 实现 的 。 那 么 怎么 让 startup .s 
汇编 出 的 代码 startup.o 在 连接 时 知晓 ISR 的 地 址 昵 ? 这 时 ， 融 要 使 用 IMPORT 指示 字 。IMPORT 后 面 
跟随 函数 名 或 变量 名 ， 作 用 相当 于 c 中 的 extern 关 键 字 ， 指 出 这 些 全 局 符号 是 在 其 它 源 文件 中 定义 
的 。 下 一 小 节 作 为 本 书 的 谢幕 ， 残 提供 了 一 个 例子 演示 了 IMPORT 的 使 用 。 
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20.8 使 用 中 断 实 现 的 秒表 示例 程序 
终于 到 了 最 后 一 节 了 ， 来 看 压轴 好 戏 吧 1 


在 这 一 小 广 中 , 将 给 出 了 一 个 最 完整 的 示例 一 一 秒表 程序 示例 。 它 使 用 了 SysTick 寞 第 和 UARTO 
中 断 。 秒 表 程序 内 部 古 以 状态 机 的 方式 实现 的 ， 其 状态 转换 图 如 下 : 


结果 被 
清除 
企 SysTick 异 常 














按 下 键 

在 上 例 的 基础 上 ， 我们 使 用 PC 来 通过 UART 以 控制 秒表 程序 的 执行 。 为 简化 示例 代码 ， 我 们 使 用 
回 定 的 56MHz 主 频 。 时 间 测 量 上 , 由 SysTick 提 供 时 基 一 一 它 以 168Hz 的 频率 给 出 异常 请 求 。 本 例 中 ， 
SysTick 以 内 核 的 56MHz 时 钟 运行 (FCLK)， 每 次 响应 SysTick 中 断 时 ， 如 果 秒 表 在 走 ， 则 把 计数 器 
加 1 一 -一目 增 TickCounter 变 量 。 

因为 使 用 UART 显 示 文 学 是 个 很 耗费 时 间 的 工作 ， 因 此 不 再 使 用 以 前 的 查询 方式 ， 而 转 用 中 靳 来 
实现 (这 也 是 编程 基本 功 )， 而 对 于 秒表 数值 的 格式 化 则 在 mani() 中 完成 (线程 模式 下 )。 程 序 中 的 
主 状态 机 由 UART 服 务 例 程 局 动 状态 转换 一 一 每 收 到 一 个 字符 转换 一 人 次 。 

使 用 上 例 的 创建 步骤 ， 我 们 再 创建 一 个 名 为 stopwatch 的 工程 。 这 次 添加 的 代码 是 


stopwatch . C: 


























#include "stdio.h" 

#define CR Ox0D // Carriage return 
#define LF OxOA // Linefeed 
void UartO0Init (void); 

void SysTickIinit (VolId) ; 
void SetClockFreqgq (void);} 
void DisplayTime (vold) ; 
void PrintValue (int value); 
int sendchar (int ch);} 

int getkey (void); 

void UartOHandler (void);} 
void SysTickHandler (void); 
// 寄存 需 地 址 


#define SYSCTRL RCC ((volatile unsigned long *) (Ox400FE060)) 
#define SYSCTRL_ RIS ((volatile unsigned long *) (0x400FEO0O50)) 
#define SYSCTRL RCGC1 ((volatile unsigned long *) (0x400FE104)) 
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#define SYSCTRL RCGC2 ((volatile unsigned long * 
#define GPIOPA AFSEL ((volatile unsigned long * 
#define UARTO_DATA ((volatile unsigned long * 
#define UARTO_FLAG ((voLatLiLle UnsSiorned. Long 
#define UARTO_IBRD ((volatile unsigned long * 
#define UARTO_FBRD ((volatile unsigned long * 
#define UARTO_LCRH ((volatile unsigned long * 
#define UARTO_CTRL ((volatile unsigned long * 
#define UARTO_IM ((volatile unsigned long * 
#define UARTO_RIS ((volatile unsigned long * 
#define UARTO_ICR ((volatile unsigned long * 
#define NVIC_IRO ENO ((volatile unsigned long * 
// 全 局 变量 

vOLatile .Tat Cursotate // 状态 机 


volatile unsigned long TickCounter; // 秒表 当前 值 
volatile int KeyReceived; // 指示 用 户 按 下 了 键 
volatile int userinput ; // 用 户 按 下 的 键 


#define IDLE_STATE 0 // 状态 的 定义 
#define RUN_STATE 1 
#define STOP_STATE 2 
Int main (void) 
| 
int CurrStateLocal; // 局 部 变量 
// 初始 化 全 局 变量 
CurrState = 0; 
KeyReceived = 0; 
// 初始 化 便 件 
SetClockFreq(); // 设置 时 钟 
UartOInit(); 
SysTLIEkKLniTt(); 
Printfi ("Stop Wat ehnNnT)s 
while (1) 
l 


RY 


(Ox400FE108)) 
(Ox40004420)) 
(Ox4000C000)) 
(Ox4000C018)) 
(Ox4000C024)) 
(Ox4000C028)) 
(Ox4000C02C)) 
(Ox4000C030)) 
(Ox4000C038)) 
(Ox4000C03C)) 
(Ox4000C044)) 
(0OXEOOUOOE100) ) 





CurrStateLocal = CurrState; // 建立 一 个 局 部 的 复 本 
// 因为 SysTick ISR 随 时 可 能 修改 它 的 值 


switch (CurrStateLocalL) { 


Case (IDLE STATE) : 


printf. (T\APress any key to Start\n™); 


break; 


Case (RUN_ STATE): 


printf ("NXnPress any key to stop\n"); 


break; 


Case (STOP_ STATE) : 


printf ("\nPress any key to clear\n"); 
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break; 


default: 


CurrSstate = IDLE STATE; 


break; 
} // end of switch 
while (KeyReceived == 0) 


{ 


if (CurrState==RUN_STATE) 


{ 
DisplayTime (); 
} 
}; // 等 竺 用 户 输入 


1If (CurrStateLocal==STOP_ STATE ) 


{ 


TickCounter=0;，; 


DisplayTime (); / /显示 ， 以 指示 结果 被 清 


} 


else if (CurrStateLocal==RUN_ STATE) 


{ 


DisplayTime (); // 显示 结果 


} 


if (KeyReceived!=0) KeyReceived=0; 


}; // end of while loop 


} // end of main 


Volid SetClockFreqgq (void) 


{ 


} 


// Set BYPASS, clear USRSYSDIV and SYSDIV 


*SYSCTRL_RCC = (*SYSCTRL RCC & OxF83FFFFF,) | Ox800 ，; 


// Clr OSCSRC, PWRDN and OEN 


*SYSCTRL_RCC = (*SYSCTRL RCC & OxFFFFCFCF); 


// 修改 sYsDIV， 设置 USRSYSDIV 和 crystal 的 值 
*SYSCTRL_ RCC = (*SYSCTRL RCC & OxF87FFC3F) | 0x01C002C0; 


// 等 待 直 到 PLLRIS 置 位 


while ((*SYSCTRL RIS & 0x40) == 


// 清除 bypass 


) 7 


// 等 待 直到 PLLLRIS 置 位 


*SYSCTRD RCGC = (*SYSCTRL RCC. & ‘OQxFEEEE TEF) ;3 


return; 


// UARTO 初始 化 
void UartO0OInit (void) 


{ 


x*SYSCTRL_RCGC1 = *SYSCTRIL_RCGC1 | 0x0003; // 使 能 UART0 & UART1 时 钟 
x*SYSCTRL_RCGC2 = *SYSCTRIL _RCGC2 | 0x0001; // 使 能 PORTA 时 钟 
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} 


*UART0_CTRL = 0; // 除 能 UART 

*UART0_IBRD = 27; // 基于 50MHz 编 程 波 特 率 

*UARTO_FBRD = 9; 

*UART0_LCRH = 0x60; // 8 bi 让 tr， 无 奇偶 

*UART0_CTRL = 0x301; // 使 能 Tx 和 RX， 并 使 能 UART 

x*UART0_IM = 0x10; // 使 能 UART 接收 中 断 

*GPIOPA_AFSEL = *GPIOPA AFSEL | 0x3; // 让 UART0 控 制 GPIO 管 脚 
*NVIC_IRQ _ ENO = (0xl1<<5); // 在 NVIC 中 使 能 UART 中 断 


return; 


XSTTCK 初始 伍 
void SysTickInit (void) 


{ 


#define NVIC_STCSR ((volatile unsigned long *) (OxEOO00E010)) 


#define NVIC_ RELOAD ((volatile unsigned long *) (OxEOO0O0OEO014)) 


#define NVIC_ CURRVAL ((volatile unsigned long *) (0xXxEO0O0E0O18) ) 


i#define NVIC_ CALVAL ((volatile unsigned long *) (OxEOO0O0EO0O1C)) 


} 


x*NVIC_STCSR = 0; // 除 能 SYSTICK 

*NVIC_RELOAD = 499999; // 基于 50MHz 主 频 的 100Hz 装 载 值 
*NVIC_CURRVAL = 0; // 清除 当前 值 

*NVIC_STCSR = 0x7; // 使 能 sSYSTICK， 使 能 中 断 ， 使 用 内 核 时 钟 


return; 





// SYSTICK 异常 服务 例 程 


Vold SysTickHandler (void) 


{ 


if (CurrState==RUN_ STATE) { 
TickCountertt+; 


} 


return; 


// UART0O RX 中 断 服务 例 程 
void UartOHandler (void) 


{ 


userinput = getkey () ; 
// 表示 收 到 了 按键 请 求 
KeyReceivedt++; 

// 释放 UART 请 求 
*UARTO_ICR = Oxl10; 

// 状态 机 转换 

switch (CurrState) 

{ 

case (IDLE _ STATE): 


CurrState = RUN STATE; 


第 26 章 


285 


Cortex-M3 权威 指南 


break; 
case (RUN_STATE): 
CurrState = STOP STATE; 
break; 
case (STOP_ STATE): 
CurrState = IDLE STATE; 
break; 
default: 
CurrState = IDLE STATE; 
break; 
} // end of switch 
return; 
} 
// 显示 时 间 值 
void DisplayTime (void) 
{ 
unsigned long TickCounterCopy; 
unsigned long TmpValue; 
sendchar (CR) ; 
TickCounterCopy = TickCounter; // 建立 一 个 局 部 的 复 本 
// 因为 SysTick ISR 随 时 可 能 修改 它 的 值 
TmpValue = TickCounterCopy / 6000; // 分 钟 
PrintValue (TImpValue); 
TickCounterCopy = TickCounterCopy - (ImpValue * 6000) ; 
TmpValue = TickCounterCopy / 100; // 秒 
sendchar(':"');，} 
PrintValue (ImpValLue) ; 
TmpValue = TickCounterCopy - (ImpValue * 100) ; 
sendchar(':"');，} 


PrintValue (TmpValue); // 1/100 秒 


sendchar(" "');，} 
sendchar(" "');，} 
return; 


} 
// 显示 10 进 制 数 值 
void PrintValue (int value) 
{ 
Peintt ‘(Sd Value)s 
return; 
} 
// 往 UART0 送 出 一 个 字符 〈 使 用 printf 来 输出 数据 ) 


Int sendchar (int ch) 


LE "eh ES 7 Yn) 
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while ((*UART0_FLAG & 0x20)); // 如 果 TXFIFO 满 则 等 符 
*UART0_DATA = CR; // 输出 附加 的 CR， 以 在 超级 终端 上 得 到 正确 的 显示 
} 
while ((*UART0_FLAG & 0x20)); // 如 果 TXFIFO 满 则 等 符 
return (*UART0_DATA = ch); // 输出 数据 
} 
// 获取 用 户 输 入 
int getkey (void) 
| 
// 从 串口 读 取 字 节 
while (*URART0O_FLRAG & 0x10); // 如 果 Rx FIFOS 则 等 符 
return (*URART0O_DRATRA) ; 
} 
/7 retargetf 出 
int fputc (int chz FILE *f£) 
{ 


return (sendchar (ch) ) ; 








为 使 用 中 断 ， 本 例 中 的 UART 初 始 化 代码 略 有 改动 。 在 使 用 中 断 前 ， 既 要 设置 UART 中 断 掩 蔽 寄存 
器 ， 又 要 设置 NVIC 来 打开 对 应 的 外 中 断 。 对 于 SysTick， 因 为 它 是 NVIC 内 建 的 ， 每 个 CM3 芯 片 都 一 
样 ， 所 以 初始 化 代码 也 是 通用 的 。 

此 外 ， 还 添加 了 若干 个 函数 ， 包 括 UART 和 SysTick 服 务 例 程 、 显 示 函 数 、 以 及 SysTick 初 始 化 
的 函数 。 根 据 外 设 的 不 同 设计 ， 中 断 服务 例 程 可 能 要 手工 清除 中 断 标 志 位 ， 也 可 能 由 硬件 清 零 。 在 
本 例 中 ， 是 通过 UART8@_ICR 来 手工 清除 的 。 

为 了 让 startup.s 能 认 出 我 们 痢 谎 加 的 两 个 中 断 服 务 例 程 ， 需 要 如 下 修改 startup .s 


有 EP Ca Co) 

















D099 DED 9| 

109 DED IntDefaultHandler 
101 IMHPORT SysTickHandler 
102 DED SysTickHandler 
103 DED IntDefaultHandler 
十 时 DED IntDefaultHandler 
195 DED IntDefaultHandler 
106 DED IntDefaultHandler 
10r DOED IntDefaultHandler 
198 IHPORT Uart86Handler 

199 DED UartdHandler 

11 和 9 DED IntDefaultHandler 


注意 IMPORT 指 示 字 的 使 用 。 它 们 后 面 跟 着 的 函数 名 是 由 其 它 源 文件 实现 的 函数 。 有 了 它 , 汇编 
占 研 知道 了 这 个 情况 ， 从 而 相应 地 处 理 。 
本 程序 的 一 次 运行 情况 ( 亦 称 为 一 个 实例 ) 如 下 图 所 示 : 
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TestllSs200 = HyperTerminal 
Fie E 明 Wiew Call Transfer Help 


DIB| 名 |3| SB| 要 





IStop Wlatch 


IPress any key to start 
IPress any key to stop 
I0:9:92 

IPress any kev to Clear 
10:0:0 

IPress any key to start 
IPress any key to stop 
0:2:25 

IPress any key to clear 
| 日: 和: 日 

IPress any key to start 


IPress any key to stop 
0:1:41 





IPress any kev to clear 


注意 : 如 果 使 用 了 虚拟 的 COM 口 ， 则 有 可 能 无 法 正常 使 用 (因为 此 时 按键 无 法 送 至 目标 板 )， 这 
是 虚拟 COM 口 驱动 程序 的 一 个 bug 导 致 的 。 如 果 遇 到 这 种 情况 ， 可 能 要 在 另 一 台 没 有 安装 过 RVMDK 的 
PC 上 测试 这 个 示例 程序 。 
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以 下 内 容 由 详 者 谎 加 ， 对 学 习 第 4 和 草 很 有 用 。 
也 可 以 使 用 和 添加 Cc 源 文 件 相 同 的 方式 ， 来 添加 汇编 源 文件 。 只 不 过 汇编 源 文件 的 
扩展 名 是 .s。 下 面 给 也 出 一 个 汇编 源 文件 的 示例 : 





三 用 吓人 


AREA Asmiest, CODE ， READONLY 
THUMB 
PRESERUES 
export HoutMouTTiest 
HouMHouTTest 
push {lr 


movt Fin, 划 Bx5678 
mou rig, 失 目 XT 之 卫生 


mou FL ， 站 上 X 之 卫生 
movut rig, 划 Bx5678 


pop {pec} 


nd 


这 里 练习 了 mov 和 movt 指 令 ( 还 刻意 演示 了 push/pop)， 为 在 Cc 程序 中 调 
用 ”MovMovTTest”， 和 需要 先 在 东 个 .h 或 在 使 用 该 函数 的 .c 文 件 中 长 明 该 函数 : 

void MovMovTTest (void); 

如 下 写 一 个 接受 参数 的 函数 ， 方 法 类 似 ， 但 是 要 使 用 ARM 的 调用 标准 ， 如 : 


Add3 








则 对 应 的 C 声 明 为 : 


Int Add3 (int a, int b, int c);} 27 bie 


这 种 例子 虽然 看 起 来 很 低 等 ， 但 是 只 是 为 了 抛砖引玉 。 读 者 可 以 用 上 和 而 例子 所 渤 示 
的 骨架 ， 去 练习 第 4 划 的 各 种 指令 ;也 可 以 试看 把 本 书 中 的 汇编 子 程序 包 北 成 可 以 由 C 调 
用 的 函数 。 
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附 孙 A 


Cortex-M3 指令 小 结 


此 附录 实际 上 是 从 cortex-M3 技 术 参 考 手 册 中 译 版 摘抄 并 改编 的 。 并 且 在 可 能 的 情况 下 ， 使 用 类 c 
语言 的 风格 来 讲解 指令 的 功能 。 另 外 要 解释 的 是 

U8 表示 unsigned char， 无 符 写 16 位 整数 

U16 表 示 unsigned short， 无 符号 16 位 整数 

S8 表 示 signed char， 和 带 从 写 8 位 整数 

S16 表示 signed short， 珊 符号 16 位 整数 

缺 省 情况 下 ， 如 果 使 用 普通 的 char 和 short， 都 是 指 带 符号 整数 

当 借 c 语 言 的 数组 表示 法 ， 如 Rn [Rm] 时 ， 是 按 整 数 运 算 的 方式 求 得 Rn+Rm 的 值 ， 然 后 把 该 值 当 作 一 
个 32 位 地 址 ， 再 取出 该 地 址 的 值 。 在 计算 地 址 时 ， 并 不 乘 以 “数据 类 型 所 占用 的 字 


方 数 "”， 这 与 C 语 言 的 数组 /指针 运算 是 概念 上 的 不 同 ， 切 记 切 记 ! 


简单 地 概括 ， 这 里 的 Rn [Rm] 等 效 于 
*( (U32 *) (Rn+Rm) )， 其 中 Rn, Rm 均 为 32 位 整数 类 型 








还 有 两 条 重要 的 通用 规则 ; 


@ ”凡是 在 指令 中 有 可 选 的 预 移 位 操作 的 ， 预 移 位 后 的 值 是 中 间 结 果 ， 不 写 回 被 移 位 的 寄存 器 
@ ”凡是 在 {s} 的 指令 中 使 用 了 s 后 缀 的 ， 都 按照 运算 结果 更 新 APSR 中 的 标志 位 。 


表 1-1 16 位 Cortex-M3 指 令 汇 总 


RD 
ADD <Rd>, #<immed_ 8> 
ADD <Rd>, <Rm> 


ADD <Rd>, SP, #<immed 8>*4 


RAND ~RO Em 


7 
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按 <contd> 条 件 决 定 是 否 分 文 
无 条 件 分 文 

Rd &= ~Rs 

软件 断 点 

带 链 接 分 文 

比较 结果 不 为 零 时 分 文 
比较 结果 为 零 时 分 文 








将 Rm 取 二 进 制 补 码 后 再 与 Rn 比较 《注意 : 


eR 


Rn 与 8 位 立即 数 比较 ,并 根据 结 来 更 新 标志 


位 的 值 


Rn 与 Rm 比较 ， 并 根据 结果 更 狐 标 记 位 的 值 


局 寄存 此 与 凯 或 低 守 存 鼎 比 较 , 并 根据 结果 更 
狐 标 志 位 的 值 。 在 实际 编程 时 ， 可 以 无 视 这 两 








SR A 








I 

以 下 面 两 条 指令 为 条 件 ; 
DT > 
以 下 面 四 条 指令 为 条 件 
多 个 连续 的 存储 占 字 加 载 





将 基 址 寄存 器 与 5 位 立即 数 偏 移 的 和 的 地 址 


处 的 数据 加 载 到 寄存 器 中 
Rd= Rn[Imm5*4] 
Rd= Rn[Rmj 


Rd= PC[Imm8*4+4] 
Rd= SP[lImm8*4] 
Rd= (U8) Rn[Imm5] 


Rd= (U8) RN[RM] 


Rd= (U16) RNn[Imm5*2] 


Rd= (U16) Rn[Rm] 








加 载 Rn+Rm 的 地 址 处 的 学 节 
Rd 中 


加 载 Rn+Rm 的 地 址 处 的 半 子 ,并 融 符 号 扩展 到 


Rd 中 


Rd= RM<<Imm5 
Rd<<= Rs 
Rd= Rm>>lmm5 
Rd>>= Rs 
Rd= (U32) Imm8 


,并 市 符号 扩展 到 


初 称 


汇编 指令 

B<cond> <target address> 
B<tartet address> 

BIC <Rd>, <Rs> 

BKPT <immed 8> 

BL <Rm> 

CBNZ <RNn>, <label> 

CE Rn “Rm > 


CMN <Rn> ， <Rm> 
CMP <Rn>， #<immed 8> 


CMP <Rn>， <Rm> 


CMP <Rn>， <Rm> 


CPoOo <eftfiect > TFT LElaos> 


SPE < 


EOR <Rd>, <Rm> 


EE<eComl > 

I <elome> 
下” > ~“conmngd> 
iT<x><y><ZzZ> <“cone> 


LDMIA <Rn>! <reglster> 


LDR <Rd>, [<RNn>, #<immed 5*4>] 


LDR <Rd>, [<Rn>， <Rm>] 


LDR <Rd>, [PC, #<immed 8>*4] 
EDBR <BR > 1Sep TF<immeo 23>*4| 


DPRE <Re > [<Rn> < mmedes | 


TR 


LDRH <Rd>, [<Rn>, #<immed 5>*2] 


LDR 


TD 


LD 


LSl <Re> <Pm < Immeads> 
TST <Ra> Rs” 
ESR Ra <Rn <1immeos> 
LSR <Rd>, <Rs> 


MOV <Rd>, #<immed 8> 
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Rd=Rn 


Rd=Rm。 实 际 使 用 时 ， 可 把 这 两 条 MOV 指令 
当成 一 条 指令 来 用 一 译 者 注 

Rd*=Rm 

Rd=~Rm 注意 ， 是 取 反 ,不 是 取 补 码 !111) 
Rd= ~Rm+1 











若干 寄存 器 和 PC 出 栈 

若干 寄存 器 压 栈 

若干 寄存 器 和 LR 压 栈 
Rd=Rn 学 内 的 字 节 反 转 

Rd=Rn 两 个 半 凶 内 的 季节 肥 转 

将 Rn 低 半 字 内 的 字 节 有 反 转 ， 册 把 反 转 后 的 值 
带 符 号 位 扩展 到 32 位 后 ， 复 制 到 Rd 中 

Rd 圆 较 右 移 = Rs 

Rd-= Rm+C 

发 送 事件 

将 多 个 寄存 器 字 保 存 到 连续 的 存储 单元 中 ,， 首 


地 址 由 Rn 给 出 。 每 保存 完 一 个 Rn+4 
Rn[Imm5*4]=Rd 

















RNn[Rm]=Rd 
SP[Imm8*4]=Rd 
*( (U8*) (Rn+lImm5) ) = (U8) Rd 


*( (U8*) (Rn+Rm) ) = (U8) Rd 
*( (U16*) (Rn+lmm5*2) ) = (U16) Rd 


*( (U16*) (Rn+Rm) ) = (U16) Rd 


Rd-= Imm8 
Rd= Rn-Rm 
SP-= Imm7*4 


操作 系统 服务 调用 ， 带 8 位 立即 数 调 用 代码 
从 寄存 器 中 提取 字 节 [7:0]， 传 送 到 寄存 器 中 ， 
并 用 符号 位 扩展 到 32 位 

从 寄存 器 中 提取 半 字 [15:0]， 传 送 到 寄存 器 中 ， 
并 用 符号 位 扩展 到 32 位 

执行 Rn & Rm， 并 根据 结果 更 新 标志 位 


从 寄存 器 中 提取 字 节 [7:0]， 传 送 到 寄存 器 中 ， 
并 用 零 位 扩展 到 32 位 
Rd= (U8) Rm 




















初 称 


汇编 指令 
MOV <Rd>, <Rn> 


MOV <Rd>, <Rm> 


MUL <Rd>, <Rm> 
MVN <Rd>, <Rm> 

NEG <Rd>, <Rm> 

NOP <C> 

ORR <Rd>, <Rm> 

POP < 寄存 器 > 

POP < 寄存 如 ，PC> 
PUSH <regLlsters> 
PUSH <registers, LR> 
REV <Rd>, <Rn> 

REV16 <Rd>, <RN> 


REVSH <Rd>, <Rn> 


ROR <Rd>, <Rs> 
SBC <Rd>, <Rm> 
SEVEE<e> 


STMIA Rn>1 “reglsters> 


STR <Rd>, [<Rn>, #<immeqd 5>*4] 
STR <Rd>, [<Rn>, <Rm>] 
STR <Rd>, [SP, #<immed 8> * 4] 


STRB <Rad> TT<Rn>> +<immee 5>| 


STRB <Rd>, [<Rn>, <Rm>] 


STRH <Rd>, [<RnNn>, #<immeqd 5> * 2] 


STRH <Rd>, [<Rn>, <Rm>] 
SUB <Rd>, #<immed 8> 
SUB <Rd>, <Rn>, <Rm> 
SUBR Sp +t<immed 7 > 47 
SVC <immed 8> 


SXTB <Rd>, <Rm> 


SXTH <Rd>, <Rm> 


TST <Rn> > <Rm> 


xTE 
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操作 汇编 指令 


从 寄存 器 中 提取 半 字 [15:6], 传送 到 寄存 器 | UXTH <Rd>, <Rm> 
中 ， 并 用 零 位 扩展 到 32 位 





Rd= (U16) Rm 
等 待 事 件 WFE <c> 
特 待 中 靳 WFI <c> 


表 1-2 列 出 了 32 位 Coxtex-M3 指 令 。 表 1-2 32 位 Coxtex-M3 指 令 汇 总 








操作 汇编 指令 

Rd=Rn+Imm12+C。 有 S 束 按 结 果 更 新 标志 位 。| ADC{S}.W <Rdq>， <Rn>， 

Ss 的 作用 下 同 。 #<modify_constant (immed_ 12> 

Rd= Rn 与 移 位 后 的 Rm 及 C 位 相 加 RC 

Rd= Rn+Imm12 ADD{S}.W <Rd>, 
<Rn>,#<modify_constant (immed 12) > 

Rd=Rd 与 移 位 后 的 Rm 相 加 RD 

Rd= Rn+Imm12 ADDW.W <RA> <Ri>S <immed e112S 

Rd= Rn & Imm12 AND{S}.W <Rd>, <Rn>， 
#<modify_constant (immed 12> 

Rd=Rn 与 移 位 后 的 Rm 按 位 与 AND(ISI WR “Rn Rn Sonice>) 

Rd = Rn>>Rm。 有 S 束 按 结 果 更 新 标 志 位 Re 

条 件 分 支 B{cond}.W <label> 

位 区 清 零 BEC.W <Rad>, H+#<lsb>, HH<width> 

将 一 个 寄存 器 的 位 区 插入 另 一 个 寄存 器 中 BFI.W <Rd>, <Rn>, #<lsb>, #<width> 

Rd= Rn & ~Imm12 BIC{S} .WW <Rd>,. <Rn>, 
#<modify_constant (immed 12)> 

Rd&= 移 位 后 的 Rn 取 反 Eee Ro Rn | el 

市 链接 的 分 文 BE Tabs< 

市 链接 的 分 文 〈 立 即 数 ) BL<C> <label> 

无 条 件 分 支 B.W <label> 

Rd=Rn 中 前 导 零 的 数目 CL27 WW <Ro> <p 

Rn 与 12 位 立即 数 取 补 后 的 值 比较 CMN.W <Rn>, #<modify_constant (immed 12)> 

Rn 与 移 位 后 的 Rm 取 补 后 的 值 比较 GLNRUE RAR 

Rn 与 12 位 立即 数 比 较 CMP.W <Rn>， #<modify_constant (immed 12)> 

Rn 与 按 需 移 位 后 的 Rm 比较 I 

Rm 的 值 不 变 

数据 存储 占 隔 离 DMB <c> 

数据 同步 隔离 DSB <c> 

Rd= Rn 人 ^ Imm12 EOR{S}.W <Rd>, <Rn>， 
#<modify_constant (immed 12)> 

Rd=Rn 与 按 需 移 位 后 的 Rm 作 异 或 操作 EOR{S}.W <Rad>, <Rn>, 去 性 二 = 太 工 之》 

Rm 的 值 不 变 

指令 同步 排序 (barrier) SEE 


多 存储 器 寄存 器 加 载 , 加 载 后 加 4 或 加 载 前 减 | LDM{IA|DB}.W <Rn>{!}, <registers> 
4 


Rxf= Rn[ofs12 LDR VW <RxfE> 7 <Rn > <offset 12>| 
PC= Rn[Lofs12 |] TR WC Pn se 
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操作 
SL 
Rxf= *RN; 
Rn+= ofs8; 
Rn+= ofs8; 
Rxf= *RN 


PC= Rn[ofs8 ] ; 
Rn+= ofs8 


Rxf=Rn[ 按 需 左 移 后 的 Rm] 
左 移 只 能 是 6,1,2,3 


PC=Rn[ 按 需 左 移 后 的 Rm] 
左 移 只 能 是 6,1,2,3 
Rxf= PC[ofs12 | 


PC= PC[ofs12 | 


Rxf=(U8) Rn[ofs12 


Rxf= (U8) *Rn; 

Rn+= ofs8 

Rxf= (U8) Rn[ 左 移 后 的 Rm]; 
左 移 只 能 是 08,1,2,3 

Rxf= Rn[ofs8 ] ; 

Rn+= ofs8 

Rxf= PCLofs12 | 


读 取 Rn 地 址 加 上 8 位 偶 移 量 乘 以 4 的 处 的 双 字 
到 Rxf( 低 32 位 )，Rxf2( 高 32 位 )， 前 索引 。 
并 且 可 选 在 加 载 后 更 新 Rn 

读 取 Rn 处 的 双 字 到 Rxf( 低 32 位 )，Rxf2( 高 
32 位 )， 并 且 在 加 载 后 Rn+= ofs8*4 


Rxf= (U16) Rn[ofs12] 

Rxf= (U16) Rn[ofs8 ] ; 
Rn+=ofs8 ; 

Rxf= (U16) *Rn; 

Rn+= ofs8; 

Rxf= (U16) Rn[ 左 移 后 的 Rm]; 
左 移 只 能 是 89,1,2,3 


Rxf= (U16) PC[ofs12] 


初 称 


汇编 指令 


玉 目 生生 全 天 全 上 和 二 合生 全 < 反扑 一 8 一 
LDR.W <Rxf>, [<RNn>], #+/-<offset 8> 


LDR.W <Rxf>, [<Rn>, #<+/-—<offset 8>]! 


EDREVW CO I<Rn > Hi/ <offset 2 >] 


EDRSW <RxFE> ><Rn > Rm | LoL i<aniete > 


| 


| 


LDR.W PC, [PC, #+/-<offset 12>] 


EDRB SW RE I<eRn > <offsetel > 


LDRB.W <Rxf>. [<Rn>], #+/-<offset 8> 


EDRBES SW <RxE> <Rn>> “Rm (Lol Hi<smrfte > 


LDRB.W <Rxf>, [<Rn>, #<+/-<offset 8>]! 


DR 


EDRD.W<Rxf> <Rxf2> 9 |<Rn > Hr/ <offset 92> 
we 


LDRD.W <Rxf>, <RXfE2>， 
#+/—<offset 8> * 4 


[<RnNn>], 


TDRA-W <RxfS, [<RnS, tx<offeset 123| 
LDRH.W <Rxf>, [<Rn>, #<+/-<offset 8>]! 
LDRH.W <Rxf>. [<RnNn>], #+/-—<offset 8> 


TDRI.W <RxfE> |<Rn>— <PRm>1 Lol ti<shrft>y| 


1 
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加 载 Rn+ofs12 地 址 处 的 字 节 ， 并 市 符号 扩展 
到 Rxf 中 


加 载 Rn 地 址 处 的 字 节 ， 并 市 符号 扩展 到 Rxf 
中 。 然 后 Rn+=ofs8 


先 做 Rn+=ofs8， 再 加 载 新 Rn 地 址 处 的 学 节 ， 
Df RE 


先 把 Rm 按 要 求 左 移 9,1,2, 3 位， 

再 加 载 Rn+ 狐 Rm 地 址 处 的 字 节 , 并 融 符 号 扩 展 
到 |Rxf 中 

加 载 PC+ofs12 地 址 处 的 宇和 有 ， 并 带 符 号 扩展 
到 Rxf 中 


加 载 Rn+tofs12 地 址 处 的 半 字 ， 并 带 符 号 扩展 
到 Rxf 中 


加 载 Rn 地 址 处 的 半 字 ， 并 带 符 号 扩展 到 Rxf 
中 。 然 后 Rn+=ofs8 


先 做 Rn+=ofs8， 再 加 载 新 Rn 地 址 处 的 半 字 ， 
并 带 符 号 扩展 到 Rxf 中 。 


先 把 Rm 按 要 求 左 移 9,1,2, 3 位 ， 

再 加 载 Rn+ 新 Rm 地 址 处 的 半 字 , 并 带 符 号 扩展 
到 Rxf 中 

加 载 PC+ofs12 地 址 处 的 半 字 ， 并 市 符号 扩展 
到 Rxf 中 


Rd= Rn<<Rnm 


Rd= Rn>>Rnm 


Rd= Racc+RN*Rm 


Rd=Racc-RNn*Rm 


Rd= Imm12 


先 按 需 移 位 Rm， 然 后 Rd= 新 Rm 

将 16 位 立即 数 传送 到 Rd 的 高 半 字 中 ，Rd 的 
低 半 字 不 受 影 啊 

将 16 位 立即 数 传送 到 Rd 的 低 半 字 中 ， 并 把 高 
半 字 清 零 

把 特殊 功能 寄存 器 的 值 传 送 到 Rd 中 

把 Rn 的 值 传 送 到 特殊 功能 寄存 器 中 

Rd= RNn*RMm 

无 操作 

Rd= Rn | ~Imm12 

完 按 需要 移 位 Rm， 然 后 

Rd= Rn | ~ 新 Rm 

Rd= Rn | Imm12 


初稿 

汇编 指令 

LDRSB.W <Rxf>, [<RN>, #<offset 12>] 
LDRSB.W <Rxf>. [<Rn>], #+/-<offset 8> 
LDRSB.W <Rxf>, [<Rn>, #<+/-—<offset 8>]! 
LDRSEBIW PxE> I<Rn>> <PRm> | Lomit<shrett yl 
LDRSB.W <Rxf>, [PC, #+/-<offset 12>] 
LDRSH.W <Rxf>, [<RN>, #<offset 12>] 
LDRSH.W <Rxf>. [<RnNn>], #+/-<offset 8> 
LDRSH.W <Rxf>, [<Rn>, #<+/-<offset 8>]! 
LDRSHeW <PxE> ~ |<Rn> <Rm> [I LSDi<anift > 
LDRSH.W <Rxf>, [PC, #+/-<offset 12>] 


LSL{S}.W <Rd>, <RNn>, <RmMm> 


LSR{S}.W <Rd>, <Rn>, <RmMm> 


MLA.W <Rd>, <Rn>， <Rm>, <Racc> 


MLS.W <Rd>, <Rn>， <Rm>, <Racc> 


MOV{S}.W <Rd>, 
+#<modify Constant (immed ll2)> 
MOV{S}.W <Rd>, <Rm>{, <shift>} 


MOVT.W <Rd>, #<immeqd 16> 


MOVW.W <Rd>, #<immed 16> 


MES<e Rl Dor> 


MSR<c> ~“Bpsasr> <frields> <Rn> 


MUL.W <Rd>, <RnNn>, <Rm> 
NOP.W 
ORN{S}.W <Rd>, <Rn>, 


#<modify_constant (immed 12)> 


ORN[S}.W <Rd>, <Rn>, <Rm>{, <shift>} 


ORR{S}.W <Rd>, <Rn>， 
#<modify_constant (immed_12) 


附录 A 
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完 控 坝 要 移 位 Rm， 人 然后 

Rd= Rn | 新 Rm 

Rd= 把 Rm 的 位 反 转 后 的 值 
Rd=Rm 和 学 内 的 凶 市 逆 问 

Rd=Rn 每 个 半 衬 内 的 学 节 逆 辐 

Rd=Rn 低 半生 内 的 季节 逆 回 后 再 符 写 扩展 
Rd= Rn 辆 财 右 移 Rm 

Rd= Imm12-Rd 





先 投 需 移 位 Rm， 然 后 
Rd= 新 Rm-Rn 
Rd= Imm12-Rn=-C 


先 按 需 移 位 Rm， 然 后 

Rd=Rn- 新 Rm-C 

抽取 Rn 中 以 1sb 写 位 为 最 低 有 效 位 ， 共 width 
宽度 的 位 段 ， 并 市 符号 扩展 到 Rd 中 

带 符号 除法 ，Rd= Rn/Rm 

发 送 事件 

带 符号 64 位 乘 加 ，RdHi :RdLo+= Rn*Rm 


带 符号 64 位 乘法 ，RdHi :RdLo= Rn*Rm 

先 按 需 移 位 Rn， 再 把 Rn 向 低 Imm 位 执行 带 符 
写 饱 和 操作 ， 并 把 结果 和 带 符 写 扩 展 后 写 人 到 Rd 
多 个 寄存 右 字 连续 保存 到 由 Rn 给 出 的 首 地 址 
中 ， 并 日 在 Rn 上， 每 存储 一 个 后 目 增 (IA)/ 
每 存储 一 个 前 目 减 (DB) 

Rn[ofs12 |=Rxf 

*RN=EFXf: 

Rn+=ofs8 

先 按 需 左 移 Rm， 然 后 

Rn[ 新 Rm]=Rxf， 左 移 格 数 只 能 是 6, 1,2,3 














Rn[ofs8 |]=Rxf 
奇 有 “! ”， 则 还 执行 Rn+=ofs8 


*( (U8*) (Rn+ofs8) ) = (U8) Rxf 
若 有 “! ”， 则 还 执行 Rn+=ofs8 


*( (U8*) (Rn+ofs12) ) = (U8) Rxf 


Ser Rn = (Ue Rxt 
Rn+=ofs8 


先 按 需 左 移 Rm， 左 移 格 数 只 能 是 8,1,2，,3， 
再 
*( (U8*) (Rn+ 新 Rm) ) = (U8) Rxf 


* (Rn+ofs8*4)=RxTf; 

*(RNn+ofs8*4+4 )=Rxf2 

奇 有 “! ”， 则 Rn+=ofs8 

*Rn=RxTf ; 

SRM A = RE2.: 

Rn+=ofs8*4 

*( (U16*) (Rn+ofs12) ) = (U16) Rxf 


先 按 需 左 移 Rm， 左 移 格 数 只 能 是 0, 1,2,3， 
二 
*( (U16*) (Rn+ 浙 Rm) ) = (U16) Rxf 


初 称 


汇编 指令 


ORR{S}.W <Rd>, <Rn>, <Rm>{, <shift>} 


RBIT.W <Rd>, <Rm> 


REV.W <Rd>, <Rm> 


REV16.W <Rd>, <Rn> 


REVSH.W <Rd>, <RnN> 


ROR{S}.W <Rd>, <RnN>, <Rm> 


RSB{S}.W <Rd>, <Rn>， 
#<modify_constant (immed 12)> 


RSB{S}.W <Rd>, <Rn>, <Rm>{, <shift>} 


SBC{S}.W <Rd>, <Rn>， 
#<modify_constant (immed 12)> 


SBEOMS Ro SG en Rn 


SBEX SW <Ra> <PRn Ilse > <widtn> 


SPV<e> “Ra > <Pn > “Pm 
SEV<c> 


SMLAL.W <RdLo>, <RdHi>, <RnNn>, <Rm> 


SMULL.W <RdLo>, <RdHi>, <Rn>, <Rm> 


SSAT <c> "<Ro>? F<im > <RNn>( <sShift>) 


SR 


STR.W <Rxf>, [<Rn>， #<offset 12>] 


STR.W <Rxf>, [<Rn>], #+/-<offset 8> 


STRoWE <RxE> <P Rm | 


STR{T} .W <Rxf>, [<Rn>, #+/-<offset 8>]{!} 


STRB{T}.W <Rxf>, [<RNn>, #+/-<offset 8>]{!} 


STRB.W <Rxf>, [<Rn>， #<offset 12>] 


STRB.W <Rxf>, [<RnNn>|], #+/-<offset 8> 


STRRB W <RxfE> "I<Pn > <BRm>{ LoDm+i<emrete>)| 


STRD .W <Rxf>, <Rxf2>, [<Rn>, #+/-<offset 8> 
:0041 人) 


SHUNEUID EIR > 
#+/—<offset 8> * 4 


[<RnNn>], 


STRH.W <Rxf>, [<RNn>, #<offset 12>] 


STREAVW <RxfE> |I<Pn>° <Rm>( LoD rt<emift>}| 


附录 人 A 
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jE 汇编 指令 
*( (U16*) (Rn+ofs8) ) = (U16) Rxf STREAIT}I EWN <RXF>I<Ri S/S<oOffset oT('Y 
若 有 “! ”， 则 还 要 执行 Rn+=ofs8 


(UT6*) Rm) = (UT6) RxE STRH.W <Rxf>, [<Rn>], #+/-<offset_ 8> 
RNn+=ofs8 
Rd= RNn-Imm12 SUB{S}.W <Rd>, <Rn>， 

#<modify oonstant (mmed | 2)> 
先 按 需 移 位 Rm SUB(SI WW Ro > Rn <Pm 时， 
Rd= Rn- 新 Rm 
Rd= RNn-Imm12 SUBWVW <a > Rn <Immednli2> 


先 按 需 圆 圈 移 位 Rm, 然后 取出 Rm 的 低 8 位 , 带 | SXTB.W <Rd>, <Rm>{, <rotation>} 
符号 扩展 到 32 位 并 存储 到 Rd 

先 按 需 圆 圈 移 位 Rm， 然 后 取出 Rm 的 低 16 位 ， 下 亲生 网 主导 <rotat ion>) 
带 符号 扩展 到 32 位 并 存储 到 Rd 

PC+= ( (U8)*(Rn+Rm) )*2 TBB [<Rn>， <Rm>] 

PC+= ( (U16)*#(Rn+Rm#k2) )*2 TE RR 


Rn 与 Imm12 按 位 异 或 ， 并 根据 结果 更 新 标志 | TEQ.W <Rn>, #<modify_constant (immedq_ 12)> 
位 
先 按 需 移 位 Rm， 然 后 TEO.W <Rn>， <Rm>{, <shift>} 


Rn 与 Rm 按 位 异 或 ， 并 根据 结果 更 新 标志 位 


RN ImMMmL21 人 7 与 > [| 根 刁 特 果 光 渭 慰 志 人 TSTW<Rn>。 中 <modify constant(immed 12)> 
先 按 需 移 位 Rm， 然 后 TT 


Rn 与 Rm 按 位 与 ， 并 根据 结果 更 新 标志 位 


抽取 Rn 中 以 1sb 号 位 为 最 低 有 效 位 ， 共 width | UBFX.W <Rd>, <Rn>, #<lsb>, #<wiqdtn> 
宽度 的 位 段 ， 并 无 符号 扩展 到 Rd 中 











无 符号 除法 Rd= Rn/Rm J 
无 符号 64 位 乘 加 ，RdHi :RdLo+= Rn*Rm UMIABIW <Ralo> SO 
无 符号 64 位 乘法 ，RdHi :RdLo= Rn*Rm UMULL.W <RdLo>, <RdHi>， <Rn>， <Rm> 


先 按 需 移 位 Rn， 再 把 Rn 同 低 Imm 位 执行 带 符 | USAT <c> <Rd>, #<imm>, <Rn>{, <shift>} 
号 饱和 操作 ， 并 把 结果 无 符号 扩展 后 与 到 Rd 

先 按 需 圆 圈 移 位 Rm, 然后 取出 Rm 的 低 8 位 无 | UXTB.W <Rd>, <Rm>{, <rotation>} 

符号 扩展 到 32 位 并 存储 到 Rd 


先 按 需 圆圈 移 位 Rm， 然 后 取出 Rm 的 低 16 位 ， | UXTH.W <Rd>, <Rm>{, <rotation>} 
无 号 扩展 到 32 位 并 存储 到 Rd 





等 行事 件 WEE.W 
等 待 中 断 WFI.W 
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了 哇 承 B 
16 位 Thumb 指令 及 架构 版 本 


表 B .1 ”不同 ARM 架 构 版 本 下 对 16 位 指令 的 改动 


mv 
Bx | lv lv IRANBX creg> 
om | 
ps | | lv opsre ci/fy, cpsio /fy 

i 





SXTB, SXTH 
UXTB , UXTH 
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附录 C 


Cortex-M3 异常 快速 参考 





优先 级 简介 
N/A 没有 异常 在 运行 
-3 ( 最 高 复位 
不 可 屏 菩 中 断 ( 来 自 外 部 NMI 输入 
脚 ) 
硬 fault 所 有 被 除 能 的 fault， 都 将 “上 访 ” 
(escalation) 成 硬 fault 。 只 要 
FAULTMASK 没有 置 位 ， 硬 fault 服 
务 例 程 就 被 强制 执行 .Fault 被 除 能 的 
原因 包括 被 禁用 ， 或 者 被 
PRIMASK/BASEPRI 掩蔽 
Mem 可 编程 人 存储 器 管理 fault，MPU 访问 犯规 以 ”NVIC SHCSR.16 
Manage ”E000_ED18 ”及 访问 非法 位 置 均 可 引 友 。 企图 在 " 非 E000_ED24 
fault 执行 区 ” 取 指 也 会 引 友 此 fault 
总 线 fault ”可 编程 从 总 线 系统 收 到 了 错误 响应 ,原因 可 NVIC SHCSR.17 
E000_ED19 ”以 是 预 取 流 产 ( Abort ) 或 数据 流产 ， E000_ED24 
或 者 企图 访问 协 处 理 器 
用 法 可 编程 由 于 程序 错误 导致 的 异常 。 通 常 是 使 ”NVIC SHCSR.18 
Fault E000_ED1A ”用 了 一 条 无 效 指令 ， 或 者 是 非法 的 状 ”E000_ED24 
态 转换 ， 例 如 党 试 切换 到 ARM 状态 
11 SVCall 可 编程 执行 系统 服务 调用 指令 ( SVC ) 引 友 ”总 
E000_ED1F ”的 异常 
12 调试 监视 可 编程 调试 监视 器 ( 断 点 ， 数 据 观 察 点 , 或 ”NVIC DEMCR.16 
E000_ED20 者 是 外 部 调试 请 求 E000_EDFC 


14 PendSV 可 编程 为 系统 设备 而 设 的 “可 悬挂 请 求 ” 总 是 
E000_ED22 (pendable request) 
SysTick ”可 编程 系统 滴答 定时 器 ( 也 就是 周期 性 溢出 ”SysTick CTRLSTAT.1 
E000_ED23 ”的 时 基 定 时 昌 译注 ) E000_E010 
16- IRQ E000_E400 ”多 达 240 条 外 部 中 断 NVIC SETENA 寄存 器 阵列 
255 
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表 C.2 ， 目 动 入 配 后 推 栈 中 的 内 容 以 及 SP 的 调整 


地 址 寄存 器 锌 保存 的 顺序 
旧 spP (N-0) 原先 已 压 
入 的 内 容 
(N-4) xPSR 2 
(N-8) PC 1 
(N-12) LR 8 
(N-16) R12 7 
(N-20) R3 6 
(N-24) R2 5 
(N-28) R1 4 
新 SP (N-32) RO0 3 





注意 : 如 果 启 用 了 堆栈 的 双 字 对 齐 特性 ， 但 是 SP 却 没 能 对 齐 到 双 字 ， 则 堆栈 帧 的 顶部 有 可 能 
从 ((OLD_SP-4) AND 0xFFFF_FFF8) 处 开始 ， 且 其 余 的 内 容 被 癌 下 错位 一 个 字 
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附录 DD 


NVIC 寄存 嘴 小 结 


表 D.1 中断 控制 器 类 型 寄 仔 器 ICTR 9XxE666 E684 


类 型 ”复位 值 
INTLINESUM R 中 断 输入 的 数量 ， 以 32 为 粒度 ， 如 
0=1 全 32 


1=33 全 64 
2=65 全 96 





表 D.2 SysTick 控 制 及 状态 寄存 器 ( 地 址 : exE686 E8610 ) 





位 段 ”名 称 类 型 。” 复位 值 ”描述 

16 COUNTFLAG RR 0 如 果 在 上 次 读 取 本 寄存 占 后 ，SysTick 已 经 数 到 
了 8， 则 该 位 为 1。 如 果 读 取 该 位 ,该 位 将 目 动 清 

2 CLKSOURCE RAW 0 6= 外 部 时 钟 源 (STCLK ) 
1= 内 核 时 钟 (FCLK ) 

1 TICKINT R/W 0 1=SysTick 倒数 到 8 时 产生 SysTick 寞 常 请求 
6= 数 到 8 时 无 动作 

9 ENABLE R/W 0 SysTick 定时 妖 的 使 能 位 


表 D.3 SysTick 重 装载 数值 寄存 器 ( 地 址 : exE666_E614 ) 


位 段 ”名 称 类 型 。 复位 值 ”描述 
23:6 RELOAD R/W 0 当 倒数 至 零 时 ， 将 被 重 状 载 的 值 


表 D.4 SysTick 当 前 数值 寄存 器 ( 地 址 : exE668 E0818) 





位 段 ”名 称 类 型 ” 复位 值 ”描述 
23:0 CURRENT R/Wc 0 读 取 时 返回 当前 倒 计 数 的 值 ， 写 它 则 使 之 清 零 ， 


同时 还 会 清除 在 SysTick 控制 及 状态 寄存 器 中 的 
COUNTFLAG 标志 


表 D.5 SysTick 校 准 数 值 寄存 器 ( 地 址 : 6xE8868_E81C ) 


位 段 ”名 称 类 型 ” 复位 值 ”描述 

31 NOREF R - 1= 没 有 外 部 参考 时 钟 (STCLK 不 可 用 ) 
8@= 外 部 参考 时 钟 可 用 

36 SKEW R - 1= 校 准 值 不 是 准确 的 16ms 


6= 校 准 值 是 准确 的 16ms 
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23:9 TENMS R/W 0 16ms 的 时 间 内 倒 计 数 的 格 数 。 必 片 设计 者 应 该 通 
过 Cortex-M3 的 输入 信号 提供 该 数值 。 大 该 值 读 
回 零 ， 则 表示 无 法 使 用 校准 功能 


表 D .6 ”SETENA/CLRENA 寄 存 器 族 


SETENASs: xEQ00 E100 - OxEO000 El1lC ; CLRENAs:O0xEOO0O0E180 - OxEO000_E19C 


SETENA1 6xE666 E164 | 中 断 32-63 的 使 能 寄存 器 ， 共 32 个 使 能 位 
SETENA7 6xE666 E11C We 中 断 224-239 的 使 能 寄存 器 ， 共 16 个 使 能 位 


CLRENA1 6xE666 E184 etl 中 断 32-63 的 除 能 寄存 器 ， 共 32 个 除 能 位 


CLRENA7 exE868_E19C 6 中断 224-239 的 除 能 寄存 器 ， 共 16 个 除 能 位 





表 D.7 SETPEND/CLRPEND 寄 存 器 族 


SETPENDs:OxEO000 E200 - OxEO000 E21C ; CLRPENDS:UxE000E280 - OxEO000_E29C 


本 


SETPEND1 9xE668 E264 闻 中 断 32-63 的 悬 起 寄存 器 ， 共 32 个 悬 起 位 
SETPEND7 6xE666 E21C 男 中 断 224-239 的 悬 起 寄存 器 ， 共 16 个 县 起 
位 
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CLRPEND1 9xE666 E284 国 中 断 32-63 的 解 基 寄存 器 ， 共 32 个 解 悬 位 
CLRPEND7 9xE666_E29C 而 中 断 224-239 的 解 悬 寄存 器 ， 共 16 个 解 悬 
位 


表 D.8 ACTIVE 寄 存 器 族 OxE6060 E36060 6XE666 E31C 
描述 


ACTIVE9 9xE666 E366 中 断 6-31 的 活动 状态 寄存 器 ， 共 32 个 状态 位 

位 [n]， 中 断 #n 活动 状态 (异常 号 16+n) 

ACTIVE1 a 6xE666 E384 - 中 断 32-63 的 活动 状态 寄存 器 ， 共 32 个 状态 
位 


ACTIVE7 Ca 6xE666 E31C 有 中 断 224-239 的 活动 状态 寄存 器 ， 共 16 个 状 
态 位 


表 D.9 中断 优先 级 宵 存 器 阵列 9XE666 E460 - 6XE666 E4EF 


EE EE 

ee 
Ne | 

re CT 


表 D.16 CPUID 寄 存 器 9XxE666 ED66 
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23:20 |R wood 





4 |R leocs mr 
En EE 




















表 D.11 中 断 控 制 及 状态 寄 仔 器 ICSR 9XxE666 ED64 

位 段 ”名称 类 型 ” 复位 值 ”描述 

31 NMIPENDSET RAW 0 写 1 以 悬 起 NMI。 因 为 NMI 的 优先 级 最 高 且 从 不 
掩蔽 ， 在 置 位 此 位 后 将 立即 进入 NMI 服务 例 程 。 

28 PENDSVSET R/W 0 写 1 以 县 起 PendSV。 读 取 它 则 返回 PendSV 的 
状态 

27 PENDSVCLR WwW 6 写 1 以 清除 PendSsV 悬 起 状态 

26 PENDSTSET R/W 0 写 1 以 悬 起 SysTick。 恋 取 它 则 返回 PendSsyV 的 
状态 

25 PENDSTCLR  W 0 写 1 以 清除 SysTick 悬 起 状态 

23 ISRPREEMPT R 0 为 1 时, 则 表示 一 个 巧 起 的 中 靳 将 在 下 一 步 时 进 
入 活动 状态 (用 于 单 步 执行 时 的 调试 目的 ) 

22 ISRPENDING R © 1= 当 前 正 有 外 部 中 断 被 惹 起 《不 包括 NMI) 

21:12 VECTPENDING R 0 县 起 的 ISR 的 编号 。 如 果 不 止 一 个 中 断 悬 起 ， 
则 它 的 值 是 这 引 动 中 断 中 ， 优 先 级 最 高 的 那 一 
a 

11 RETTOBASE R 0 当 从 异常 返回 后 将 回 到 其 级 (base level), 日 





没有 其 它 异 常 悬 起 时 ， 此 位 为 1。 若是 在 线程 模 
式 下 , 在 某 个 服务 例 程 中 ， 有 不 止 一 级 的 异常 处 
于 活动 状态 , 或 者 在 异常 没有 活动 时 执行 了 措 常 
服务 例 程 ( 此 时 执行 返回 指令 将 产生 fault。 此 
乃 高 危 行 为 ， 大 是 专用 )， 则 此 位 为 8 

9:6 VECTACTIVE R 0 当前 活动 的 ISR 编 号 ， 访 位 段 指 出 当前 运行 中 的 
ISR 是 哪个 中 断 的 〈 提 供 守 和音 序 号 )， 包 括 NMI 和 
便 fau1lt。 如 果 多 个 异常 共享 一 个 服务 例 程 ， 该 例 程 可 
根据 本 位 段 的 值 来 判定 是 哪 一 个 寞 第 的 啊 应 导致 它 的 执 
行 。 把 本 位 段 的 值 减 去 16, 束 得 到 了 外 中 断 的 编号 ， 并 
可 以 用 此 编号 来 操作 外 中 断 相 关 的 使 能 / 除 能 等 寄存 器 。 




















表 D.12 疝 量 表 偏 移 量 寄存 器 (VTOR) 9XE666 ED68 

位 段 ”名 称 类 型 ”复位 值 描述 

7-28 TBLOFF RW 9 问 量 表 起 始 地 址 

29 TBLBASE R - 向 量 表 是 在 Code 区 (6)， 还 是 在 RAM 区 (1) 
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表 D.13 应 用 程序 中 断 及 复位 控制 寄 仔 路 (AIRCR) 6xE666_ED6C 


位 段 ”名称 类 型 ”复位 值 描述 
31:16 VECTKEY RW - 访问 钥 是 : 任何 对 该 吾 存 器 的 写 操作 ， 都 必 
须 同 时 把 @x85FA 写 入 此 段 ， 否 则 写 操作 被 
忽略 。 知 读 取 此 半 字 ， 则 6xFA65 
ENDIANESS 指示 如 设置 。1 三 大 病 (BE8)，6 三 小 痪 。 此 
值 是 在 复位 时 确定 的 ， 不 能 更 改 。 











16:8 PRIGROUP 优先 级 分 组 
SYSRESETREQ 请 求 蕊 片 控 制 逻 辑 产 生 一 次 复位 
VECTCLRACTIVE W 清 堆 所 有 异 第 的 活动 状态 信息 。 通 单 只 在 调 
试 时 用 ， 或 者 在 0S 从 错误 中 恢复 时 用 。 
VECTRESET 复位 CM3 处 理 器 内 核 〈 调 试 逻 辑 除外 )， 但 
是 此 复位 不 影响 芯片 上 在 内 核 以 外 的 电路 








表 D.14 系统 控制 宵 存 器 9xE666 ED10 


位 段 ”名 称 类 型 ”复位 值 
SEVONPEND 发 生 弄 沼 上 巧 起 时 请 发 送 事件 , 用 于 在 一 个 新 的 中 
断 悬 起 时 从 WFE 指令 处 唤醒 。 不 管 这 个 中 断 的 优 
先 级 是 否 比 当 前 的 高 ， 都 唤醒 。 如 果 没 有 WFE 导 
致 睡眠 ， 则 下 次 使 用 WFE 时 将 立即 唤醒 


当 进 入 睡眠 模式 时 ， 使 能 外 部 的 SLEEPDEEP 信 
le 





在 响应 异常 的 自动 入 栈 操作 时 ， 强 制 SP 对 
齐 到 双 字 地 址 上 。 修 订 版 无 此 功能 


在 便 fault 与 NMI 服务 例 程 中 忽略 数据 总 
线 fault 


4 除数 为 零 时 陷入 用 法 fault 
RW 0 


0 NONBASETHRDENA 非 基 于 线程 模式 使 能 位 。 如 果 为 1, 则 允许 
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| 异常 服务 例 程 通过 修改 EXC_RETURN， 使 其 
在 线程 模式 下 执行 


表 D.16 系统 异常 优先 级 寄存 器 OxE000 ED18 - OxE000 ED23 














地 址 名 称 类 型 ” 复位 值 ”描述 
@XxE666 ED18 PRI 4 存储 器 管理 fault 的 优先 级 


@xE666 ED26 PRI 12 调试 监 视 器 的 优先 级 
6XxE666 ED22 PRI 14 PendSyv 的 优先 级 
6XxE666 ED23 PRI 15 SysTick 的 优先 级 





表 D.17 系统 Handler 控 制 及 状态 寄存 器 SHCSR OxE000_ED24 
位 段 ”名 称 类 型 ” 复位 值 ”描述 


17 BUSFAULTENA RN 8 总 线 fault 服务 例 程 使 能 位 
16 MEMFAULTENA R/W 06 存储 器 管理 fault 服务 例 程 使 能 位 
15 © SVCALLPENDED SVC 悬 起 中 。 本 来 已 经 要 SVC 服务 例 程 ， 但 
是 却 被 更 珊 优 先 级 异常 取代 
BUSFAULTPENDED R/W 0 总 线 fault 基 起 中 ， 细 节 同 上 。 
13 MEMFAULTPENDED R/W 0 存储 器 管理 fault 县 起 中 ， 细 节 同 上 
SYSTICKRACT R/W 9 SysTick 异常 活动 中 
16 PENDSVACT R/W 0 PendSV 寞 党 活动 中 
DE 
SVCALLACT i SVC 异 第 活动 中 
[ri 
EE 


1 BUSFAULTACT R/W 0 总 线 fault 异常 活动 中 
6 MEMFAULTACT R/W 9 存储 器 管理 fault 异常 活动 中 














表 D.18 存储 器 管理 fault 状态 寄存 器 (MFSR) ” 0xE000_ED28 
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段 值 
wevatD  - 8 =1 时 表示 MMAR 有 效 | 
vstkerk RMWc 6 入 栈 时 发 人 错误 
匡 雪 天 







MUNSTKERR R/Wc 9 出 栈 时 发 生 错 误 
网 区 DACCVIOL R/Wc 数据 访问 违例 


表 D.19 总 线 fault 状态 青 存 器 (BFSR) OxE000 ED29 
- =1 时 表示 BFAR 有 效 
R/Wc 0 入 栈 时 发 生 错 误 
R/Wc 0 出 栈 时 发 生 人 错误 
R/Wc 0 不 精确 的 数据 访问 违例 (violation) 
R/Wc 0 精确 的 数据 访问 违例 
R/Wc 0 取 指 时 的 访问 违例 





表 D.20 用 法 fault 状态 寄存 器 (UFSR)， 地 址 : 0xE000_ED2A 





位 段 ”名 称 类 型 ”复位 值 描述 
DIVBYZERO R/Wc 6 表示 除法 运算 时 除数 为 零 ( 只 有 在 DIV_68_TRP 
置 位 时 才 会 发 生 ) 
UNALIGNED R/Wc 0 未 对 齐 访 问 导 多 的 fault 
NOCP R/Wc 6 试图 执行 协 处 理 器 相关 指令 





INVPC R/Wc 6 在 异常 返回 时 试图 非法 地 加 载 EXC_RETURN 
到 PC。 包 括 非 法 的 指令 ， 非 法 的 上 下 文 以 及 
非法 的 值 。The return PC 指向 的 指令 试图 
设置 PC 的 值 (要 理解 此 位 的 含义 ， 还 需 学 习 
后 面 的 讨论 中 断 级 异常 的 莉 市 ) 


1 INVSTATE R/Wc 6 试图 切入 ARM 状态 
1 UNpEFINsTR RMwc 0 执行 的 指令 其 编码 是 未 定义 的 一 一 解码 不 能 
表 D.21 硬 fault 状态 寄存 器 OxE000 ED2C 


DEBUC JE 
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FORCED R/Wc 0 便 fault 是 总 线 fault, 存储 器 管理 fault 
或 是 用 法 fault 上 访 的 结果 
VECTBL R/Wc 6 硬 fault 是 在 取向 量 时 发 生 的 


表 D.22 调试 fault 状态 寄存 器 (DFSR) 0xE000_ED30 





EE EE 
人 EXTERNAL R/Wc EDBGREQ 信号 有 效 

EN vearan R/Wc 6 发 生 向 量 加 载 

| DWTTRAP R/Wc 6 发 生 DWT 匹配 

BKPT R/Wc 6 执行 到 BKPT 指令 

1 HALTED R/Wc 6 在 NVIC 中 请 求 HALT 


表 D.23 存储 管理 地 址 寄存 器 (MMAR) “0xE000_ED34 


al 


触发 存储 管理 fault 的 地 址 





表 D.24 总 绕 fault 地址 寄存 器 (BFAR) ”0xE000_ED38 


:jE BFAR : - 触发 总 线 fault 的 地 址 





表 D.25 辅助 fault 地 址 寄存 器 (AFAR) ”OxE000_ED3C 


31:0 二 证 


表 D.26 MPU 类 型 寄存 器 MPUTR OxE 0 00_ED90 


23:16 IREGION MPU 支持 的 指令 region 数量 。 因 为 ARMV7-M 
只 使 用 单个 统一 的 MPU， 此 位 段 永远 为 零 


15:8 DREGION MPU 支持 的 数量 。 若 系统 中 配 了 MPU 则 为 8， 
否则 为 零 


9 se Re ES 





表 D.27 MPU 控制 寄存 器 MPUCR ( 地址 : 0xE000 ED94 ) 
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1 HFNMIENA 1= 在 NMI 和 便 fault 服务 例 程 中 不 强制 除 能 MPU 
6= 在 NMI 和 便 fault 服务 例 程 中 强制 除 能 MPU 


表 D.28 MPU region 号 寄 仔 器 MPURNR (地址 : 0xE 000_ED98) 





表 D.29 MPU region 号 寄存 器 MPURNR (地址 : 0xE 000_ED9C) 


决定 是 否 理 会 写 入 REGION 字 上 段 的 值 


1=MPU region 写 寄存 器 被 REGION 和 窗 茜 


=MPU region 写 寄存 器 的 值 保持 不 变 
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表 D.30 MPU region 属 性 及 容量 寄存 器 MPURASR ( 地 址 : 0xE000_EDAO ) 
位 段 | 长 | 名 称 功能 












































度 

31:29 |3 | - 体 留 

28 1 | XN [a 
2= 此 区 允许 取 指 

27 ja | 保留 

26:24 |3 | AP 访问 许可 ， 如 下 表 所 示 
值 特权 级 下 的 许可 | 用 户 级 下 的 许可 | 典型 用 法 
0b000 ， 禁 地 禁地 区 医 这 有 存 亿 带 国定 年 直 引 
0b001 | RW 2 oS 和 和 系统 软件 使 用 的 数据 区 
0b010 RW RO 禁止 在 用 户 级 下 更 改 的 高 危 地 带 
Ob011 | RW RW 共享 内 存 ， 或 彻 寿 开 放 的 设备 
0b100 n/a ia n/a 
0b101 | RO 禁地 os 使 用 的 第 量 数据 
0b110 RO RO 第 量 数据 或 上 只 读 存储 器 的 地 址 区 
0b111 | RO RO 第 量 数 据 或 只 读 存 储 占 的 地 址 区 

2 2 | | 保留 

217190 3 1 TR 类 型 扩展 

18 1 S Sharable (可 否 共 享 ) 
1= 共 享 可 
0= 共 至 不 可 

16 1 B Buffable (可 和 否 缓冲 ) 
1 二 2 
0= 缓 冲 不 可 

15:8 | 8 |SRD 子 region 除 能 位 段 。 每 设置 SRD 的 一 个 位 ， 就 会 除 能 与 之 对 应 的 一 个 子 region。 容 
量 大 于 128 宇 下 的 region 都 被 划分 成 8 个 容量 相同 的 子 region ,容量 小 于 等 于 128 学 方 
的 region 不 能 再 分 。 更 多 信息 ， 请 参见 对 了 于 Region 的 论述 。 

7:0 2 - 保留 

5:1 5 REGIONSIZE | Region 容 量 ， 单 位 是 学 节 。 容 量 为 1<< (REGIONSI2ZE+1) ， 但 是 最 小 容量 为 32 字 下 

0 1 SZENABLE Teen 0= 除 能 此 region 


表 D.31 调试 停机 控制 及 状态 寄存 器 DHCSR ( 地 址 : 0xE 0 00_EDF0O) 


位 段 名 称 类 型 | 复位 值 | 描述 
31:15 | KEY W - 调试 钥 是 。 必 顷 在 任何 号 操作 申 把 该 位 段 写 入 
A85F， 否 则 忽略 写 操 作 
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25 |SRESET ST |R |- | 内 核 已 经 或 即将 复位 读 后 清 零 

24 |s_RETIRE ST|R |- | 在 上 次 读 取 以 后 指令 已 执行 完成 ， 读 后 清 零 
19 |S_LOCKUP |R |- |1= 内 核 进 入 锁定 状态 

18 |sstEEP |R |- |1 内 核 攻 眼中 | 
17 JSHALT |JR |- |1- 内 核 E 信 机 
16 |SREGRDY |R |- | 寄存 器 的 访问 已 经 完成 


15:6 | 保留 |- | - 

5 |C_SNAPSTALL | RW |8@r | 打 断 一 个 stalled 存储 器 访问 

4 | 名 -|- |， 
3 |CMASKINTS | RW |e* | 调试 期 间 关 中 断 ， 只 有 在 停机 后 方 可 设置 

2 |CsTEP | 网 |8@x | 让 处 理 器 单 步 执 行 ,在 C_DEBUGEN=1 时 有 效 
日 |CDEBUGEN |RW |e* | 使 能 停机 模式 的 调试 


表 D.32 调试 内 核 寄 仔 器 选择 者 寄 仔 器 DCRSR ( 地 址 : 0xE 0 00_EDF4 ) 


REGWNR 人 
6= 读 寄存 


ED 


EE 
4:0 REGSEL 96666= Re 

00661=R1 

91111=R15 

16666=XxPSR 

16961=MSP 

16916=PSP 

16166= 特 殊 功 能 寄存 央 组 
[31:24]: CONTROL 
[23:16]: FAULTMASK 
[15:8]: BASEPRI 
[7:6]: PRIMASK 


表 D.33 调试 内 核 寄存 器 数据 寄存 器 DCRDR ( 地 址 : 0xE 0 00_EDF8 ) 


31:6 DATA R/W 苇 贺 米 的 亲 存 帝 的 介 因 或 名 写 大 半 存 人 的 但 司 告 
存 器 由 DCRSR 选择 


表 D.34 调试 乃 及 监视 器 控制 寄存 器 DEMCR ( 地 址 : 0xE 0 00_EDFC ) 


名 称 

















24 | TRCENA 跟踪 系统 的 使 能 位 。 在 使 用 DANT,ETM,ITM 和 
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”| | TPIU 前 必须 先 设置 此 位 

3:20 保 外 | | 
RW 1= 调 试 监视 器 异常 不 是 由 硬件 调试 事件 触发 ， 而 是 由 

| 软件 手工 县 起 的 

18 |MONSTEP |RW |8 | 让 处 理 器 单 步 执行 ,在 MON_EN=1 时 有 效 

17 MON_PEND |RW “8@ | 用 起 监视 器 异常 请 求 ,内 核 将 在 优先 级 允许 时 响应 

6 JMONEN | Ry |e | 使 能 调试 监视 器 异常 

5 | 保 和 | | | 

9 VCINTERR 

放 尖 辐 缚 

Ey 

EM 

站 


发 生 用 法 fault 之 无 处 理 器 错误 时 停机 调试 

发 生存 储 器 管理 fault 时 停机 调试 
| 
VC_CORERESET | RN 发 生 内 核 复位 时 停机 调试 

*: DEMCR 中 的 控制 位 是 在 上 电 复 位 时 得 到 复位 的 。 系 统 复位 〈 例 如, 往 NVIC 应 用 程序 中 断 及 复位 寄存 器 中 写 命令 ) 
不 会 影响 到 它们 


表 D.35 软件 触发 中 断 寄 存 器 STIR OxE000_EFO0O 


发 生 总 线 fault 时 停机 调试 
发 生 用 法 fault 时 停机 调试 
RW 
RW 
RW 


VC CHKERR RW QO+* 发 生 用 法 fault 使 能 的 检查 错误 时 停机 调试 
(如 未 对 齐 ， 除 数 为 零 ) 


En 
EMERR RM 
i 

















位 段 ”名 称 类 型 ” 复位 值 ”描述 
8:0 INTID W : 影响 编号 为 INTID 的 外 部 中 断 , 其 县 起 位 被 置 位 。 


例如 ， 写 入 8， 则 惹 起 IRQ #8 


表 D36 中 断 优先 级 寄 仔 器 阵列 0xE000_E400 - 0xE000_E4EF 


名 称 类 型 地 址 复位 值 措 述 
et ee 
Dem ee 后 


PERIPHID3 R | exE6868 EFEC 8 ”外 设 ID 寄 存 器 3 
PCELLID1 R exE660_ EFF4 组 件 ID 寄存 器 1 
PCELLID3 R |@xE060_ EFFC 组 件 ID 寄存 器 3 
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A 


Cortex-M3 疑难 解答 


E.1 简介 


使 用 CM3， 一 大 令 人 闹 心 之 处 就 是 会 有 那么 多 的 faults, 不 知 什么 时 候 束 会 来 一 个 。 来 的 是 哪 
个 ， 为 什么 来 ， 如 何 避 免 ” 这 连珠 炮 一 般 的 问题 简直 成 了 学 习 的 拦路 虎 了 。 

其 实 ， 只 要 我 们 掌握 和 理解 得 深入 ， 不 粗心 ， 规 范 设 计 和 和 编程， 这些 faults 束 成 了 纸老虎 。 
如 果 善 加 利用 ， 甚 至 还 能 变 害 为 利 一 一 在 系统 出 现 故障 时 由 它们 为 我 们 提供 有 用 的 诊断 信息 一 一 这 
才 是 CM3 设计 这 些 faults 的 初衷 。 

当 fault 发 生 时 ， 首 先 要 弄 清 楚 的 束 是 fault 源 ， 下 表 列 出 了 相关 的 寄存 器 














表 E.1 CM3 中 的 fault 状态 寄存 器 组 


人 MemManage fault 状态 寄存 器 


总 线 fault 状态 寄存 器 各 
调试 fault 状态 寄存 器 


上 上 表 的 为 一 可 视 化 视图 如 下 图 所 示 : 
31 16 15 8 7 0 


oxEooo EDsc 
OxE000 Epao 
OxE000 ED2C 
oxEooo ED28 


图 E.1 各 fulat 状态 寄存 器 的 地 址 组 织 

为 MMSR，BFSR 和 UFSR 的 地 址 是 相连 的 , 所 以 可 以 使 用 按 字 加 载 指令 一 次 性 地 全 部 读 进 来 。 
在 这 种 情况 下 ， 这 个 三 合 一 的 fault 状态 让 有 一 个 名 学 : 可 配置 fault 状态 寄存 器 (CFSR ) 。 

另 一 个 提供 重要 信息 的 寄存 堪 是 什么 ? 它 远 在 天 边 ， 近 在 眼前 一 一 人 尽 缘 知 的 程序 计数 吉 PC! 
进入 fault 服务 例 程 后 ， 当 时 的 PC 值 在 (SP-8x24) 处 。 因 为 CM3 中 有 两 个 堆栈 指针 ，fault 服务 
例 程 还 要 判定 发 生 fault 时 使 用 的 是 哪 一 个 堆栈 一 一 MSP 还 是 PSP。 

进一步 地 ， 对 于 总 线 fault 和 存储 器 管理 fault， 有 了 时 还 能 精确 定位 後 事 指 令 的 地 址 一 一 当 
MMAVALID/BFARVALID 位 被 置 位 时 , 即 是 精确 fault。 此 时 , 存储 器 管理 fault 的 地 址 存储 在 MMAR 
中 ， 总 线 fault 的 地 址 则 存储 在 BFAR 中 。 在 物理 实现 上 ，MMAR 与 BFAR 其 实 是 同一 个 寄存 需 ， 
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此 同一 时 刻 只 能 用 一 个 一 一 这 是 因为 同一 时 刻 只 能 出 现 一 个 fault (但 是 访问 地 址 还 是 不 同 的 )， 
如 表 E.2 所 示 。 


表 E.2 CM3 中 的 fault 地 址 寄存 器 


MemManage fault 地 址 寄存 器 





最 后 ， 在 执行 fault 服务 例 程 时 ，LR 寄存 需 的 值 也 帝 关 是 一 个 线索 ， 间 接 反 映 了 发 生 fault 
时 的 情景 。 如 果 fault 是 由 无 效 的 EXC_RETURN 值 导致 的 ， 则 进入 fault 时 ，LR 的 值 则 是 上 次 异 





第 返回 时 使 用 的 EXC_RETURN 值 。Fault 服务 例 程 可 以 据 此 上 报 有 问题 的 LR 值 ， 从 而 使 开发 人 员 
可 以 检查 为 何 会 使 用 非法 的 EXC_RETURN (常常 是 粗心 造成 的 )。 


E.2 设计 Fault 服务 例 程 


用 于 开发 阶段 的 fault 服务 例 程 , 与 用 于 实际 系统 中 的 服务 例 程 ,在 绝 大 多 数 场 合 下 是 截然 不 
同 的 。 对 于 软件 开发 ，fault 服务 例 程 应 关注 于 准确 及 时 地 上 报 发 生 fault 时 上 下 文 ; 而 实际 系统 
中 的 fault 服务 例 程 则 要 把 这 当 作 是 危急 关头 来 处 理 ， 它 要 尽 可 能 地 想 办 法 来 恢复 系统 ， 实 在 不 可 
救 要 时 可 能 只 有 重启 。 这 里 我 们 主要 讨论 前 者 ， 因 为 后 者 是 比较 有 技术 含量 的 ， 而 且 不 同 的 应 用 需 
要 不 同 的 策略 。 

对 于 比较 复杂 的 软件 ， 通 党 不 直接 在 fault 服务 例 程 中 报告 与 fault 相关 的 状态 ， 而 是 把 它 
倾倒 (专业 术语 : dump) 到 一 块 专用 的 内 存 中 (主要 包括 fault 状态 寄存 器 ， 通 用 寄存 器 ， 自 动 入 
栈 的 内 容 等 )， 接 着 悬 起 PendSV。 等 到 PendSsyV 服务 例 程 执行 后 ， 再 上 报 问 题 。 这 是 因为 上 报 过 程 
执行 的 工作 可 能 比较 多 ， 夜 长 梦 多 一 一 有 可 能 在 上 报 过 程 中 又 不 小 心 触发 了 其 它 的 fault， 使 得 处 
理 器 被 锁 死 。 因 此 先 暂 记 下 来 ， 稍 后 转交 PendSV 人 处理。 如 果 软 件 很 简单 ， 则 可 以 其 情 简化 fault 
的 处 理 过 程 ， 甚 至 直接 在 服务 例 程 中 上 报 。 


E.2.1 上报 fault 状态 寄 行 右 


Fault 服务 例 程 最 基本 的 工作 就 是 上 报 fault 状态 寄存 器 的 值 ， 即 上 网 所 列 出 的 那些 。 


E.2.2 上 报 入 栈 的 PC 


定位 入 栈 PC 的 流程 如 下 图 所 示 
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A \ 根据 LR.2 的 值 ， 判 定 fault 
\、 /发 生 时 使 用 的 是 唉 个 堆栈 


LR.2=0 0 LR.2=1 





当时 使 用 的 是 MSP 当时 使 用 的 是 PSP 


从 (xSP-0x24 ) 处 读 取 入 栈 PC 





E.2 ”定位 入 栈 PC 的 流程 图 
上 图 所 示 的 工作 流程 可 以 由 如 下 代码 来 沽 示 : 





TST LR, #0x4 ; EXC_RETURN .2=0? 
ITTEE EQ ; 如 是 为 索 ， 则 

MRSEQ RO, MSP ; 把 MSP 加 载 入 RO 中 

LDREQ RO, [RO,#24] ; 从 MSsP 中 获取 入 栈 的 PC 
MRSNE RO, PSP ; 否则 ， 就 把 BSP 加 载 入 RO 中 
LDRNE RO, [RO,#24] ; 从 PSP 中 获取 入 栈 的 PC 





为 了 辅助 调试 ， 应 该 同时 创建 一 个 反 汇 编 的 指令 列表 《如 末 使 用 RVMDK， 则 有 目 动 创建 )， 从 而 
可 以 容易 地 定位 问题 所 在 。 


E.2.3 上 报 fault 地 址 寄生 器 


如 果 MMARVALID 或 BFARVALID 为 1， 则 可 以 提供 出 事 时 的 地 址 。 但 要 注意 的 是 ， 当 
MMARVALID/BFAVRALID 被 清除 后 ，fault 地 址 寄存 器 中 的 值 可 能 被 擦 除 。 因 此 ， 必 须 先 读 
BFAR/V/MMAR， 再 读 BFARVALID/MMARVALID。 如 果 后 者 为 零 ， 则 丢弃 读 出 的 地 址 值 。 最 后 一 步 再 清 
除 BFARVALID/MMARVALID。 

如 条 先 谈 取 了 状态 位 , 则 有 可 能 在 下 一 步 操 作 前 被 其 它 fault 异 单 抢占, 这 也 是 一 种 蒜 乱 危 象 ， 
有 可 能 导致 下 述 的 错误 处 理 序 列 : 

1. 读 取 BFARVALID/MMARVALID 
2. 发 现 VALID 位 有 效 ， 于 是 准备 谈 BFAR/MMAR 
3。 高 优先 级 异常 抢占 了 fault 服务 例 程 ， 而 且 它 又 触发 了 另 一 个 fault， 导 致 另 一 个 fault 服务 

例 程 被 执行 
4. 高 优先 级 fault 服务 例 程 清除 了 BFARVALID/MMARVALID， 导 至 BFAR/MMAR 被 擦 除 。 

5 。 国 到 先前 的 fault 服务 例 程 ， 此 时 再 读 取 BFAR/MMAR 时 ， 内 容 已 经 丢失 了 了。 

可 见 , 后 读 取 VALID 位 , 可 以 减少 这 种 茶 乱 危 象 出 现 的 概率 (但 如 果 还 没 来 得 及 读 取 BFAR/MMAR 
束 出 现 了 被 抢占 的 情况 ， 则 只 能 看 人 品 了 ， 所 以 最 好 第 一 件 事 束 是 读 取 BFAR/MMAR 一 一 译 者 注 )。 
清除 fault 状态 位 

在 fault 上报 完毕 后 ,一 定 不 要 忘记 清除 FSR 中 的 fault 状态 位 ,否则 下 次 再 发 生 fault 时 ， 
就 分 不 清 FSR 中 的 状态 位 是 反映 新 来 的 fault， 还 是 反映 以 前 的 fault 了。 而且， 如果 fault 地 
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址 有 效 位 没有 清除 ， 下 次 发 生 fault 时 ，BFAR/MMAR 的 值 就 无 法 更 新 。 


E.2.4 其 它 注 意 事项 


我 们 经 常 需要 在 fault 服务 例 程 的 开始 处 保存 LR 的 值 。 然 而 ， 如 果 fault 是 由 于 堆栈 操作 和 错 
误导 致 的 ， 此 时 再 把 LR 压 栈 吏 更 添乱 了 。 但 我 们 已 经 知道 ，R3-R6 以 及 R12 的 值 已 经 被 保存 ， 
此 我 们 可 以 在 呼叫 其 它 函 数 之 前 先 把 LR 的 值 捞 贝 到 它们 中 去 事实 上 在 出 现 堆栈 错误 时 ， 是 无 法 保证 寄 
存 器 已 经 正音 入 栈 了 的 。 此 时 的 问题 比较 赫 手 。 可 能 行 得 通 的 作法 是 ， 在 SRAM 中 专门 开 出 一 个 块 服务 于 fault 服 
务 例 程 ， 并 把 通用 寄存 器 的 值 保 存 到 那里 ， 但 这 种 办 法 无 法 用 于 峰 套 的 情况 一 一 这 已 经 很 外 牛角 尖 了 )。 


E.3 任 C 中 上 报 入 标的 寄 仔 器 和 各 fault 状态 寄 仔 器 


大 多 数 的 CM3 项 目 还 是 以 CC 语言 为 主 的 。 然而， 在 C 中 不 方便 定位 和 和 直接 访问 堆栈 帧 《入 栈 的 
寄存 右 )。 因 为 在 标准 C 语言 中 是 不 能 获取 SP 指针 的 。 因此， 如 果 使 用 C 来 写 fault 服务 例 程 ， 最 
好 配合 一 小 段 汇编 码 来 获取 SP 的 值 ， 再 把 该 值 以 一 个 参数 传送 给 fault 上 报 函 数 。 

译注 : 在 使 用 MDK 目 带 的 ARM 编译 器 时 ， 可 以 使 用 _builtin_ frame_address() 函 数 来 获取 堆栈 帧 的 地 址 。 
在 GNU 工具 中 也 可 以 这 样 做 。 此 法 方便 ， 并 且 可 取代 上 文 的 通用 作法 ， 但 降低 了 编译 器 间 的 可 移植 性 。 

这 个 机 制 与 第 12 草 讲 的 SVC 郊 例 相同 (在 C 中 使 用 SVC”)。 下 例 束 以 租 入 式 汇 编 的 方式 来 演 
示 。 这 个 例子 可 以 在 RealView MDK 中 编译 。 

示例 程序 的 第 一 部 分 是 个 汇编 封皮 。 在 使 用 前 ， 要 在 问 量 表 中 的 便 fault 入 口 地 址 项 中 ,填写 
好 该 封 肥 的 入 口 地 址 。 这 个 封皮 代 人 码 把 正确 的 堆栈 指针 值 氨 贝 到 Re 中 ， 以 作为 参数 来 传送 给 C 图 
数 。 


















































// 使 用 汇编 写 就 的 硬 fault 服务 例 程 
// 该 例 程 提取 堆栈 帆 的 位 置 并 且 把 它 传递 
// 给 Cc 程序 


asm void hard fault handler asm(void) 


i 


IMPORT hard fault handler _c 
TST LR, #4 

TTE EQ 

MRSEO RO; MSP 

MRSNE RU PSP 

B hard_ fault handler _c 





示例 程序 的 第 二 部 分 ， 也 是 主体 部 分 ， 使 用 C 语言 来 写 。 在 这 里 ， 我 们 主要 是 演示 如 何 访 问 入 
栈 的 寄存 器 和 fault 状态 寄存 器 。 


// 使 用 c 写 就 的 硬 fault 服务 例 程 
// 第 一 个 参数 即 堆栈 帧 的 位 置 
void hard fault handler c(unsigned int * hardfault args) 
{ 
unsigned int stacked ro0; 
unsigned int stacked rl]l; 
unsigned int stacked r2; 
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unsigned int stacked r3; 


unsigned int stacked rl12; 


unsigned int stacked lr; 


unsigned int stacked pc; 


unsigned int stacked psr; 


stacked _r0 = ((unsigned long) hardfault args[0]); 


stacked rl = ((unsigned long) hardfault args[1|]); 


stacked r2 = ((unsigned long) hardfault args [2]); 


stacked r3 = ((unsigned long) hardfault args[3]); 


stacked rl2 = ((unsigned long) hardfault args[4]); 


stacked lr = ((unsigned long) hardfault args[5]); 


stacked pc = ((unsigned long) hardfault args[6]); 


stacked psr = ((unsigned long) hardfault args[7]); 








brintf ("[Hard fault handler] \n"); 
printf ("RO = %x\n", stacked_r0),，; 
printf ("R1 = %x\n", stacked rl]1),，; 
printf ("R2 = %x\n", stacked r2); 
printf ("R3 = %x\n", stacked_ r3); 
printf ("R12 = %x\n", stacked r12),，; 
printf ("LR = %x\n", stacked_ 1r),，; 
printf ("PC = %x\n", stacked_ pc),，; 
printf ("PSR = Sx\n", stacked psr); 
printf ("BFAR = $x\n", (*((volatile unsigned long *) (OxE000ED38)))); 
printf ("CFSR = $x\n", (*((volatile unsigned long *) (OxE000ED28)))); 
printf ("HFSR = %x\n", (*((volatile unsigned long *) (0xEO0O0OED2C) ) ) ) ; 
printf ("DFSR = %$x\n", (*((volatile unsigned long *) (OxE000ED30)))); 
printf ("AFSR = %$x\n", (*((volatile unsigned long *) (OxE0OO00ED3C)))); 
exit (0); // terminate 
return; 
} 
请 注意 : 如 果 友 生 了 堆栈 洲 出 或 其 它 错 识 ， 使 SP 指 问 了 无 效 的 存储 空 对 衬 区 域 ， 则 上 段 代码 会 失 
能 。 在 大 多 数 情 况 下 ， 这 种 错误 都 会 影响 C 代码 ， 因 为 所 有 C 代码 都 需要 堆栈 。 


理解 发 生 fault 的 原因 


在 收集 到 捷 需 的 信息 后 ， 驳 需要 分 析 问 题 了 。 表 E.3- 表 E.7 列 出 了 导致 faults 的 典型 原因 。 


上 .4 
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表 E.3 MemManage fault 状态 寄存 器 提供 的 讯息 


MSTKERR 入 栈 时 发 生 错 误 ( 异 常 啊 应 序列 开始 时 ) 
1) 堆栈 指针 的 值 被 破坏 
2) 堆栈 容易 过 大 ， 已 经 超出 MPU 允许 的 region 范围 


MUNSTKERR 出 栈 时 发 生 错 误 (异常 响应 序列 终止 时 )。 入 栈 时 没有 发 生 错 误 ， 出 栈 时 却 出 
彰 ， 总 令 人 有 些 诽 夷 所 思 ， 可 能 的 原因 是 
. 异常 服务 例 程 破坏 了 堆栈 指针 


.异常 服务 例 程 更 改 了 MPU 配置 
内 存 访问 保护 违例 。 这 是 MPU 发 挥 作用 的 体现 。 常 常 是 用 户 应 用 程序 企图 访 
问 特权 级 region 所 至 
IACCVIOL ， 内存 访问 保护 违例 。 和 帝 负 是 用 户 应 用 程序 企图 访问 特权 级 region。 在 这 种 情 
况 下 ， 入 栈 的 PC 给 出 的 地 址 ， 就 是 产生 问题 的 代码 之 所 在 
， 跃 转 到 不 可 执行 指令 的 regions 
， 异 各 返回 时 ， 使 用 了 无 效 的 EXC_RETURN 值 
向量 表 中 有 无 效 的 向 量 。 例 如 ， 异 常 在 向 量 建立 之 前 就 发 生 了 ， 或 者 加 载 的 
是 用 于 传统 ARM 内 核 的 可 执行 映像 
.在 异常 处 理 期 间 ， 入 栈 的 PC 值 被 破坏 了 


























表 E.4 忆 线 fault 状态 寄存 器 提供 的 讯 妃 


位 可 能 的 原因 
STKERR ( 目 动 ) 入 栈 期 间 出 错 
1. 堆栈 指针 的 值 被 破坏 
2. 堆栈 用 量 太 大 ， 到 达 了 末 定 义 存储 器 的 区 域 
3。 PSP 未 经 初始 化 就 使 用 
UNSTKERR (自动 ) 出 栈 期 间 出 错 。 如 果 没 有 发 生 过 STKERR， 则 最 可 能 的 就 是 在 异常 
处 理 期 间 把 SP 的 值 破坏 了 
IMPRECISERR 与 设备 之 间 传 送 数据 的 过 程 中 发 生 总 线 错误 。 可 能 是 因为 设备 未 经 初始 化 而 
引起 ;或 者 在 用 户 级 访问 了 特权 级 的 设备 ， 或 者 传送 的 数据 单位 尺寸 不 能 关 
设备 所 接受 。 此 时 ， 有 可 能 是 LDM/STM 指令 造成 了 非 精确 总 线 fault。 
PRECISERR 在 数据 访问 期 间 的 总 线 错 误 。 通 过 BFAR 可 以 获取 具体 的 地 址 。 发 生 fault 




















的 原因 同上 。 
IBUSERR 同 MemManage fault 中 的 IACCVIOL 
表 E.5 用 法 fault 状态 寄存 器 提供 的 讯息 
位 可 能 的 原因 
DIVBYZERO ” 当 DIV_8_TRP 置 位 时 则 发 生 了 除数 为 零 的 情况 。 引 发 此 fault 的 指令 可 以 从 入 栈 
的 PC 读 取 





UNALIGNED ” 当 UNALIGN_TRP 置 位 时 发 生 未 对 齐 访 问 。 引 发 此 fault 的 指令 可 以 从 入 栈 的 PC 
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| 读 取 
NOCP 企图 执行 一 个 协 处 理 器 指令 。 引 发 此 fault 的 指令 可 以 从 入 栈 的 PC 读 取 
INVPC 1。 异 第 返回 时 使 用 了 无 效 的 EXC_RETURN， 例 如 


1) 当 EXC_RETURN=6xFFFF FFF1 时 却 要 返回 线程 模式 
2) 当 EXC_RETURN=6xFFFF FFF9 时 却 要 返回 handler 模式 
2. 无 效 的 异种 活动 状态 ， 例 如 
1) 当前 措 各 的 活动 状态 已 经 清除 了 ， 却 在 此 时 执行 异 利 返回 。 往 往 是 因为 小 
用 VECTCLRACTIVE 或 清除 了 SHCSR 中 活动 状态 所 致 
2) 在 尚 有 异常 的 活动 位 置 位 时 ， 却 要 返回 线程 模式 
3。. 由 于 堆栈 指针 错误 导致 IPSR 的 值 不 正确 。 对 于 INVPC fault， 入 栈 的 PC 
指出 了 该 fault 服务 例 程 在 何 处 抢占 了 其 它 代 人 码 。 这 个 问题 往往 是 由 比较 隐 星 
的 程序 错误 造成 的 ， 欲 详细 调查 该 问题 的 原因 ， 最 好 使 用 ITM 的 跟踪 功能 。 
4. ICI/IT 位 对 当前 指令 无 效 。 当 LDM/STM 指令 被 异常 打 断 后 ， 在 异常 服务 例 程 
中 又 更 改 了 入 栈 的 PC。 绪 果 在 中 断 返 回 时 ， 非 零 的 ICI 位 段 作 用 到 了 不 使 用 
ys ICI 位 段 的 指令 上 。 如 采 是 其 它 原 因 破 坏 了 PSR 的 值 ， 也 可 能 导致 此 fault。 
INVSTATE ” 1. 加载 到 PC 中 的 跳 转 地 址 值 是 偶数 (LSB=8)。 通 过 检查 入 栈 PC 的 值 ， 一 下 子 
束 可 以 查 出 该 问题 。 
2. 向 量 地 址 的 LSB=8， 诊 断 方 法 同上 。 
3. 入 栈 的 PSR 在 异常 处 理 过 程 中 被 破 坏 ， 使 得 在 返回 时 内 核 和 尝试 进入 ARM 状态 。 

































































1. 使 用 了 CM3 不 支持 的 指令 

2. 代码 段 中 的 数据 被 破坏 

3。 连接 时 加 载 了 ARM 目标 码 。 请 检查 编译 阶段 的 设置 

4. 指令 对 齐 的 问题 ,例如 ,在 使 用 GNU 工具 链 时 ,忘记 了 在 .ascii 后 使 用 .align， 
束 有 可 能 导致 下 一 条 指令 没有 对 齐 


表 E.6 硬 fault 状态 寄存 器 提供 的 讯 妃 


DEBUGEVF 因 调 试 事件 导致 的 fault 
1. 上 断 点 /观察 点 事件 
2. 在 便 fault 服务 例 程 的 执行 过 程 中 ， 没 有 使 能 监视 器 异常 (MON_EN=8) 也 
没有 使 能 停机 调试 〈C_DEBUGEN=6)， 却 执行 了 BKPT 指令 。 缺 省 时 ， 有 些 
C 编译 占 可 能 会 在 半 主 机 代码 中 使 用 BKPT 指令 。 
FORCED 这 是 fault“ 上 访 ” 的 情况 


UNDEFINSTR ， 





























.试图 在 SVC/ 监 视 器 服务 例 程 中 执行 SVC/BKPT， 或 者 在 其 它 拥 有 相同 或 更 


高 优先 级 的 服务 例 程 中 执行 SVC/BKPT。 
， 发 生 了 fault， 但 是 它 的 服务 例 程 被 除 能 
. 发生 了 fault,， 但 是 当前 处 理 器 在 啊 应 同 级 或 更 高 优先 级 的 异常 
4. 发 后 了 fault， 但 是 它 被 掩蔽 了 


VECTBL 取 回 量 失 败 ， 
1. 在 取 癌 量 过 程 中 发 生 总 线 fault 
2. 问 量 表 偏 移 量 设置 有 误 


表 E.7/ 调试 fault 状态 寄存 器 提供 的 讯 妃 
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Cortex-M3 权威 指南 附录 E 


可 能 的 原因 
Me 





BKPT 1. 执行 了 BKPT 指令 
2. FPB 单元 产生 了 断 点 事件 
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